[ gojava @ 09.11.2003. 10:58 ] @
Imao bih dosta posla sa OCR-om. Interesuje me koji je skener <120E dovoljno brz i pouzdan za ove poslove i koji software je najbolji. Pre svega me zanima, koliko dobro je moguce skidati tabele i prebacivati ih u MSWord format?
[ Corleone @ 09.11.2003. 11:53 ] @
Za skener ne znam koji je dobar, pošto svakih 10-tak minuta na tržištu se pojavi novi skener.
Za software za skidanje teksta sa papira ili OCR program mogu od sveg srca preporučiti ABBYY Fine Readre Professional 6.0 koji je stvarno cool i skida tabele u Wordu kao od šale.
Ako se odlučiš za njega mogu ti baciti link na privatnu poruku.

Pozdrav
[ markic @ 09.11.2003. 12:14 ] @
Citat:
Corleone:
Ako se odlučiš za njega mogu ti baciti link na privatnu poruku.

Ja sam zainteresovan za link.
[ gojava @ 09.11.2003. 15:38 ] @
Da cuo sam za Fine Reader. Imao sam prilike i da ga vidim na kretko na delu i fino je radio. jedino sto osoba koja je radila sa njime nikada ranije nije skenirala tabele pa joj to nije uspelo dok sam prisustvovao demonstraciji. Zato sam i postavio pitanje.
Koliko je meni poznato Fine Reader posto je ruski proizvod ima tu prednost za nas sto dobro prepoznaje nasa slova, inace OmniPage Pro je isto toliko dobar kao OCR program.
Video sam na netu da postoji jos gomila OCR programa koji nama nisu poznati a koji se hvale da perfektno rade sta ti padne na pamet. Mozda je istina, a mozda i nije.

Nego prvo oko skenera. Treba mi brz skener, a kad ga vec kupujem trebalo bi da ima i solidan kvalitet skeniranja fotografija. Koliko sam uspeo da se raspitam, redosled bi bio: Epson, Umax, HP ...

Ima li jos neki predlog.?

A, da. Vazno mi je (mada ne narocito) i kako OCR skida grcka slova i matematicke formule.
[ Corleone @ 09.11.2003. 15:58 ] @
Citat:
gojava:
Koliko je meni poznato Fine Reader posto je ruski proizvod


Mislim da ABBYY Fine Reader nije ruski proizvod....

Citat:
gojava:
A, da. Vazno mi je (mada ne narocito) i kako OCR skida grcka slova i matematicke formule.


Jesam dosta "opterećivao" Fine Reader, ali nisam nikada skenirao grčka slova i formule. Mislim da može formule da prepoznaje ako se kao jezik stavi DIGITS (brojevi). Inače ima da se skine dosta jezičkih postavki pa verovatno i grčki.

Što se tiče skenera za OCR, ja mislim da nije toliko bitno pošto ja imam Bear@Paw 1200CU Plus, koji nije nešto "besan" u svojoj klasi, ali kada radim sa Fine Reader-om onda je izuzetan.
Inače, Fine Reader ima svoj interfejs za skeniranje teksta tako da se sva podešavanja stave na Default i on posle samo piči. Nema problema što se toga tiče. Mnogo dobar programčić, nema šta. Vidim skoro i da je izašla verzija 7.0 ali nisam našao link za skidanje.

Pozdrav
[ jogurt @ 09.11.2003. 18:27 ] @
Sto se softvera tice, mogu samo da potvrdim ono sto su ljudi vec rekli. Ubedljivo najbolji je ABBY FR 6, ali ipak i on, koliko znam, ima problema sa cirilicom jer srpskog paketa jos uvek nema na njihovom sajtu (ispravite me ako gresim).

Inace, imao sam vrlo lepa iskustva sa Croation recnikom koji odlicno odradjuje latinicne skenove na srpskom.

Alternativa za cirilicu, jedina normalna za koju znam, jeste OmniPage 12. Iako pravi dosta gresaka, moze da se natera da radi ako se dobro podese kontrast i brajtnes i ako ono sto se skenira nije suvise lose (fotokopije, stare knjige i sl.)

Sto se izbora hardvera tice, a to je cini mi se da je bas to bila tema, mislim da je to najmanje vazno osim ako nije potrebna brzina. E sad zasto? Zato sto se snaga OCR algoritama ne bazira toliko na velikoj rezoluciji i kvalitetnom skeniranju, koliko na upotrebi recnika. Takodje algoritmi na bazi neuralnih mreza nisu imali mnogo uspeha jer to zahteva dugo "treniranje" softvera da bi se dobili razumno dobri rezultati (upravo slucaj sa OmniPageom), a da ne pricam o tome, da taman kad "naucite" softver da cita jedan otisak, dodje sasvim drugaciji materijal i sve morate da radite ispocetka :-(

Iz svega se moze zakljuciti da je samo brzina kljucni faktor koji odredjuje koji skener kupiti. Jedan slepi momak kome sam svojevremeno pomagao, procitao je silne knjige pomocu jednog bednog MUSTEKA 1200! a on ne kosta ni 50 E

Srecno!

[ Corleone @ 09.11.2003. 19:07 ] @
Totalno se slažem sa kolegom koji je odgovorio pre mene.
Snaga OCR prepoznavanja teksta je ustvari u rečnicima koje on podržava a ne u skeneru. Ja sam još pre naveo da sam, a i sada isto radim, dosta posla uradio sa Mustekom 1200 CU Plus, koji se nije nešto ekstra pokazao u Photoshop-u, ali u ABBYY Fine Readeru fantastično radi posao.

Na njihovom sajtu sam našao podršku za Russian Language, ali je nikad nisam koristio i ne znam kako prepoznaje ćirilicu.

Moj ti je savet, procunjaj malo Internetom, vidi da skineš verziju 7.0 možda ona ima neka poboljšanja sa ćirilicom. Ne troši vreme skidajući verziju 6.0 kada možeš odmah preći na 7.0.

Navešću kratak primer: ja sam sa skenerom dobio neku verziju Fine Reader-a 4.0 i to je bila verzija demo ili tako nešto, ne sećam se, koja je posao sa latinicom odrađivala silom i jedva. Imao sam i problema prilikom skeniranja, nisam znao da podesim kontraste i sl. Onda sam nabasao na verziju 6.0 koja "skida" latinicu k'o od šale i skeniranje se vrši automatski. Samo "zalepiš" papir na skener, u programu dugme Scan&Read i pusti ga neka odradi posao. Ništa ne diraš, samo gledaš.

Ah da, Fine Reader prepoznaje i PDF fajlove i konvertuje ih u format Word Document.

Pozdrav i srećno

P.S. za link još važi ponuda, ako se odlučiš.
[ gojava @ 10.11.2003. 07:35 ] @
Nije mi problem za software. Mislim da cu moci da ga nadjem kod nekih prijatelja. javi cu ako bude frka.

Nego, posto prvi put kupujem skener za sebe licno, ne bih da uzmem bas najnizu klasu. Bear Paw imam u firmi i nisam bas nesto zadovoljan njime. Vise puta sam bio u prilici da skeniram fotografije mikrostruktura nekih metalnih materijala. Fotografije su sve crno-bele i ne znam da li ste ikad videli tako nesto, ali moram da vam kazem da su mi vrlo bitne nijanse na njima. Bear Paw se nije bas pokazao. Takve fotografije sam kasnije uvek morao da stampam na laseru koji je 1200x1200 da bi se koliko-toliko ocuvao kvalitet prikaza. Zbog toga bih hteo nesto malo kvalitetniji skener: Epson 1690 ili UMAX 4700?
[ broker @ 10.11.2003. 09:31 ] @
Za cirilicu korsitite stariju verziju Fine Reader-a (mislim 5.x) koja to odlicno radi.
[ jogurt @ 10.11.2003. 09:37 ] @
Citat:
broker:
Za cirilicu korsitite stariju verziju Fine Reader-a (mislim 5.x) koja to odlicno radi.


Da li FR u ranijim verzijama koristi recnik?

A sto se tice one ideje sto je neko pomenuo - da se Russian paket iskoristi za preopznavanje cirilice - cisto sumnjam da bi radilo bas zbog tehnologije koriscenja recnika. Medjutim, treba probati ... ko zna ... praksa najmerodavnija.
[ djolep @ 10.11.2003. 09:43 ] @

Ako imas puno tabela da skeniras, pobrini se da ti otisci budu besprekorni. Ako su tabele velike, ili ako ih je mnogo, jako je tesko postici pouzdan rezultat. I Fine Reader i OmniPage su odlicni, ali broj gresaka direktno zavisi od kvaliteta otiska. Nije mali posao proveriti tabelu koja je krcata brojevima, a gresaka ne sme biti.

Vrlo cesto mi je manji posao bio kreiram tabelu nego da proveravam da nije neka osmica postala trojka ili obratno.
[ gojava @ 10.11.2003. 10:11 ] @
Jos nesto sam zaboravio.

Cuo sam da postoji program koji skenirane dijagrame moze da digitalizuje, tj. da ih prevede u analiticki oblik. Meni bas to konkretno i nije potrebno; vise bi mi vrsilo posao da svaki dijagram bude skinut u obliku tabele sa vrednostima za "x" i "y". Napominjem da imam mnogo takvih dijagrama.

Ima li tu neke pomoci?
[ force_m @ 13.11.2003. 00:11 ] @
fine reader.. jeste ruski program...
ja koristim verziju 6 i pokazala se odlicno.... postoji i dodatak za prepoznavanje cirilice... i program to stvarno dobro radi... npr. na jednom A4 listu krcatom teksta... potkrala mu se 1-2 greske.
[ Corleone @ 13.11.2003. 00:22 ] @
Pazi ovamo, skinuo sam ABBYY Fine Reader 7.0, koji je stvarno izvrstan. Radi kao zmaj. Sa sobom nosi i program Form Filler, koji služi za popunjavanje obrazaca. Odličan je.
Mogu vam baciti link za skidanje pa vidite kakav je. Fajl koji se skine u .RAR formatu je i ima crack sa sobom.

Pozdrav
[ jogurt @ 13.11.2003. 11:25 ] @
force_m:

A koji je taj dodatak? Mislim, jel to recnik za Srpski ili nesto sasvim trece?

corleone:

Can I have link for FR 7, pls?

hvala
[ jogurt @ 13.11.2003. 22:25 ] @
Sorry, Corleone!

Ali link koji si mi bacio ne radi :-( Doduse na sajtu u dl sekciji se spominje FR7, ali od linka ni traga. Mozes li da me na private informises o velicini instalacije (MB) i da li imas neki drugi link...? Voleo bih jednog mog prijatelja koji je slep da obradujem novom (i nadam se boljom verzijom)

Fala
[ force_m @ 13.11.2003. 23:41 ] @
evo linka za download dodatka za prepoznavanje srpske cirilice... (FR 7)

http://fr7.abbyy.com/fr70addlang/exe/OtherLang.exe

za srpski jezik ne postoji recnik za FR vec samo ovaj dodatak koji omogucava prepoznavanje nasih slova.
[ zvecko @ 21.11.2003. 06:16 ] @
Pozdrav...

Jedan od najboljih OCR programa koji sam sreo i koji koristim gotovo 4 godine je Abbyy FineReader i to verzije 4 koju ne nameravam da je menjam. Probao sam i novije verzije ovog programa koje su neosporno SAVREMENIJE sa nekim dodatnim opcijama i mogucnostima, ali nijedna mi nije radila kao ova. U okviru programa data je podrska za gotovo sve jezike uključujući cirilicu. A sto je najlepse ne postvalja dodatna glupa pitanja prilikom skeniranja.
Sto se tice tabela iz fine reader-a vrlo lako mozes da ih prebacis u bilo koji drugi program (Copy-Paste). Preporucujem da sam odredis tabelu pre prepoznavanja.
U zavisnosti od kopije teksta prepoznavanje je i do 90% i veće.

[ triangle @ 26.07.2004. 17:40 ] @
evo ja imam abbyy 7.0 i sve OK i serbian language support, ali skenira na kraju samo bijelo bude u wordu, znaci skenira, ali ne prebaci u word na kraju

upomoc ljudi, korist je to ne mala
[ kime1 @ 04.09.2004. 13:32 ] @
Nemoj se ubijati više tražeći....ja napisah u nekoj sličnoj temi nedavno da ne može ćirilica u word,jerbo su to novi sistemi zaštite od piraterije...džaba sve...to važi za abbyy7 i izgleda 6,(try&buy,a izgleda samo to ima na našem tržištu),tako da ako neko ima rešenje (neko drugo) za ćirilicu,ja sam veoma zainteresovan (posmatram)...verzijom 4 sprint nikako nisam zadovoljan (ispremešta sve živo),a crackovana 4 se isto nešto pobunila pa neće da radi (pokazuje na neki error)....
Da li abbyy 5 radi ok ili sl.? (sve mi se čini da treba tražiti nešto drugo za ćirilicu)
[ milorad @ 04.09.2004. 17:09 ] @
ma nema ništa drugo ovo je najbolje , samo da ga provalimo, na nekim diskusijama kažu da kod njih radi OK , zato ja propadoh tražeći sve wareze obiđoh ..al idemo dalje..
[ BeastMaster @ 04.09.2004. 17:48 ] @
Zanimljivo da meni Abby FineReader 7.0 radi bez ikakve greške na poslu već mesecima...
[ kime1 @ 04.09.2004. 18:27 ] @
Misliš ćirilicu?Onda nije try&buy,jer na sajtu im piše da ne može ćirilica (bilo koja)...
[ BeastMaster @ 04.09.2004. 19:05 ] @
Prepoztnaje i ćirilicu i latinicu bez ikakvih problema, samo sam instalirao i paket sa ćiriličnom podrškom koji sam inače skinuo sa abby-ovog sajta...
[ milorad @ 04.09.2004. 19:40 ] @
pa reci ,covece, u cemu je fora, kako si instalirao ,sve redom koja ti je verzija ,ajde bre pricaj polomih se a ti ladno ,meni sve radi , danima pokusava sve zivo .....ajde , ajde ....cekam ....
[ kime1 @ 04.09.2004. 19:41 ] @
Aj' budi dobar pa malo pobliže objasni (baci link do tog dodatnog paketa)
[ BeastMaster @ 04.09.2004. 19:56 ] @
Ja sam to stvarno odavno skinuo (inače se radi o FR 7.0 Pro) pa ako nekome trebaju jezički paketi sa našom podrškom mogu da pošaljem na mail, to je oko 1.5Mb.

Pozdrav.
[ milorad @ 04.09.2004. 20:01 ] @
ja imam jezicki paket otherlang.exe i pokaze da ima dosta nekih jezika a medju njima i srpska cirilica i srpska latinica sa lainicom nema problema al cirilica nikako daj posalji bilo sta samo da probamo..
[ yu7br @ 09.06.2005. 23:37 ] @
Jel neko imao iskustva sa skeniranjem cirilice u text
scanjet hp 3400c odnosno njegov originalni softver, ima mogucnost za rusku, al meni treba za srpsku cirilicu
Hvala