[ Časlav Ilić @ 22.09.2002. 11:57 ] @
Nedavno pročitah tekst na temu statističkog filtriranja spama, pa me zanima zna li neko nešto više o ovome? Tekst možete naći na http://www.paulgraham.com/spam.html, a za one koji pristupaju iz lokala, trenutno sam ga okačio sam i kod sebe na http://home.drenik.net/caslav/spam.html. Nisam ga postovao ovde zato što je poduži (ali je vrlo zanimljiv!).

Na osnovu navedenog teksta, deluje mi da bi bilo lako napisati program koji će tako da filtrira poruke. Jedini razlog zbog kojeg nisam lično probao da napišem takav program, je to što bi svaku poruku trebalo pretvoriti u čist tekstualni oblik pre statističke analize, a nemam vremena da istražujem šta sve može da se zadesi u nekoj poruci.
[ stinger @ 22.09.2002. 13:29 ] @
sve to moze vrlo lako da se odradi sa regex-om, a ostatak je relativno jednostavan, problem je samo integracija sa postojecim MTA-om