[ Miroslav Strugarevic @ 24.02.2007. 00:07 ] @
Ovaj dokument objašnjava instaliranje i podešavanje FuzzyOCR plugin-a za SpamAssassin na FreeBSD operativnom sistemu.

Ako primetite neku grešku u tekstu molim javite.

Potrebno je instalirati sledeće programe ako već nisu instalirani.
# cd /usr/ports/graphics/netpbm && make install clean
# cd /usr/ports/graphics/ImageMagick && make install clean
# cd /usr/ports/graphics/gocr && make install clean
# cd /usr/ports/devel/p5-String-Approx && make install clean
# cd /usr/ports/security/p5-Digest-MD5 && make install clean
# cd /usr/ports/graphics/libungif && make install clean


Nakon toga sledi instalacija plugin-a.
# wget http://users.own-hero.net/~dec...uzzyocr/fuzzyocr-latest.tar.gz
# tar xzvf fuzzyocr-latest.tar.gz
# cd FuzzyOcr-2.3b
# cp FuzzyOcr.cf FuzzyOcr.pm /usr/local/etc/mail/spamassassin
# cp FuzzyOcr.words.sample /usr/local/etc/mail/spamassassin/FuzzyOcr.words
# touch /var/log/fuzzyocr.log
# chown spamd:spamd /var/log/fuzzyocr.log


Ovo su neke osnovne stavke koje treba izmeniti u FuzzyOcr.cf fajlu da bi plugin bio funkcionalan.
focr_logfile /var/log/fuzzyocr.log
focr_global_wordlist /usr/local/etc/mail/spamassassin/FuzzyOcr.words
focr_bin_giffix /usr/local/bin/giffix
focr_bin_giftext /usr/local/bin/giftext
focr_bin_gifasm /usr/local/bin/gifasm
focr_bin_gifinter /usr/local/bin/gifinter
focr_bin_giftopnm /usr/local/bin/giftopnm
focr_bin_jpegtopnm /usr/local/bin/jpegtopnm
focr_bin_pngtopnm /usr/local/bin/pngtopnm
focr_bin_ppmhist /usr/local/bin/ppmhist
focr_bin_convert /usr/local/bin/convert
focr_bin_identify /usr/local/bin/identify
focr_bin_gocr /usr/local/bin/gocr


Za kraj testiranje plugin-a pomoću test mail-ova.
# wget http://users.own-hero.net/~decoder/fuzzyocr/sample-mails.tar.gz
# tar xzvf sample-mails.tar.gz
# spamassassin -t -D < ocr-gif.eml
# spamassassin -t -D < ocr-png.eml
# spamassassin -t -D < ocr-jpg.eml
# /usr/local/etc/rc.d/sa-spamd restart


Ako FuzzyOCR završi posao bez grešaka (možete ih videti u /var/log/fuzzyocr.log fajlu) trebalo bi da imate funkcionalan FuzzyOCR plugin.
Jedna napomena: koliko sam uspeo da primetim na svom test računaru ovaj plugin zahteva mnogo procesorske snage i ram memorije zato pazite ako planirate da ga koristite na slabijem računaru. Verujem da će novije stable verzije biti mnogo zahvalnije po pitanju potrošnje resursa.

Pozdrav!

[Ovu poruku je menjao Miroslav Strugarevic dana 24.02.2007. u 01:17 GMT+1]
[ misk0 @ 24.02.2007. 21:47 ] @
Svaka cast! Ja bih ovo u TOP stavio i mislim da bi neki drugi forum bio adekvatniji. Ako ko ima prijedlog - nek javi.
[ Tyler Durden @ 25.02.2007. 15:15 ] @
Što se mene tiče može u TOP, ali ne znam koji bi drugi forum bio prikladniji. Najbolje nek ostane ovdje?
[ windows_zakon @ 04.03.2007. 18:08 ] @
A, jeli efikasan ?
[ Miroslav Strugarevic @ 05.03.2007. 00:04 ] @
Bolji nema za sada. Postoji ImageInfo plugin za prepoznavanje image spama, ali on ne skenira sliku. Već samo radi prepoznavanje (tip) i veličinu slike. Sa druge strane FuzzyOCR radi kompletno skeniranje slike, izvlači reči koje se nalaze u slici i prema tome vrši bodovanje poruke što je naravno mnogo bolja stvar. Sa ImageInfo-om mi se dešavalo da validne poruke budu blokirane, dok je to kod FuzzyOCR-a mnogo preciznije. Naravno zbog toga FuzzyOCR troši više resursa od ImageInfo-a. Test server je moja kućna mašina, ne koristim je za slanje mail-a, tako da nemam prilike da isprobam 100% mogućnosti FuzzyOCR-a. Mislim da je vredan pažnje. Čekam sledeću stable verziju koja će imati bolju podršku za čuvanje skeniranih poruka u internoj bazi što će nadam se dati bolje rezultate.
[ misk0 @ 05.03.2007. 11:43 ] @
U prethodnom broju hrvatske 'Mrez@' Dinko Korunic je pisao o jos jednom metodu borbe protiv spam-a, ali ne mogu se sjetiti naslova alata odnosno metoda. Kad pronadjem, napisacu.
[ Miroslav Strugarevic @ 11.03.2007. 19:31 ] @
Pokušao sam da podesim FuzzyOCR na Gentoo Linux-u ali bez uspeha. Verovatno zbog grsec patcheva koji iz nekog razloga ubijaju gocr. Probaću bez grsec-a pa ću javiti kako i šta. Možda napišem još jedan kratak HOWTO na tu temu. Problem je taj što Gentoo Linux još uvek nema sve potrebne pakete u portage-u (tačnije ima ali su zavedeni kao unstable). Još nešto, po forumuma čitam preporuke kako je bolje koristiti unstable verziju FuzzyOCR-a 3.5.x od stable verzije.
[ misk0 @ 11.03.2007. 21:25 ] @
Taj metod koji je spominjao je CRM114. Imas li iskustva sa tim?
[ Miroslav Strugarevic @ 11.03.2007. 21:44 ] @
Nemam iskustva tako da ne mogu da komentarišem. Za sada nemam nekih većih problema sa SpamAssassin-om tako da ne planiram promenu :)
[ Miroslav Strugarevic @ 21.03.2007. 17:56 ] @
Probao sam FuzzyOCR devel na FreeBSD-u. Radi odlično.

Instalacija je vrlo jednostavna:
# cd /usr/ports/mail/p5-FuzzyOcr-devel/
# make install clean
# cp /usr/local/share/examples/FuzzyOcr/FuzzyOcr.* /usr/local/etc/mail/spamassassin/

Pošto je devel verzija instalirana uz pomoć portova nije potrebno nikakvo editovanje conf fajla za početak korišćenja.