[ franjo_tahi @ 14.10.2008. 20:29 ] @
| Radi se o novom projektu koji je u fazi izrade zadatka, a potrebne su mi stvari kojima se do sada nisam bavio:
1. Da li je moguče napraviti scan (ne nepoznatom scaneru) direktno iz delphi-a?
2. Od scaniranog dokumenta kreirat PDF
3. Editirati PDF - dodavati ili brisati stranice
4. Dokument provuči kroz OCR, tj. dobiti tekstualni sadržaj dokumenta.
Znam rješenje korištenjem externih programa poput Adobe-a, ali bih to želio integrirati u program, po mogučnosti s VCL kontrolama, bez OCX-a.
Svaki prijedlog je dobrodošao, kao i eventualna stranica s koje se može skinuti demo kontrole (ako postoji) ili bar da ima dobar opis rada. Naročito me zanima da li tko ima iskustva s tim. |
[ obucina @ 15.10.2008. 00:58 ] @
1. Trazi komponentu koja u opisu ima "Twain Source ", to je za skenere, ima radio sam sa tim.
2. i 3. Nadji neku PDF biblioteku ili PDF exporter. Neki report alati (Report Mnager) imaju mogucnost izvoza u PDF, pa mozes to da koristis.
4. Ne vidim razlog zasto ne bi moglo, ali ovako, iz glave, ne znam ni za jednu native OCR komponentu.
[ Deep|Blue @ 15.10.2008. 07:43 ] @
[ franjo_tahi @ 16.10.2008. 07:54 ] @
hvala na odgovorima. Za scan sam pronašao kotrolu, EZTWAIN i radi odlično. Jednostavna za korištenje... problem je samo kako napraviti scan više stranica odjednom, s automatski uvlačenjem. Scaner mi pri pokušaju uvlačenja druge stranice javi grešku... moram se malo igrati.
Kontrolu za OCR i konverzija u PDF je malo veći problem. Njih nisam pronašao (a da nisu preskupe), 2000$ mi je ipak previše. Volio bih da nisu OCX kontrole (radi jednostavnije instalacije kod kupca).
Je li neko radio OCR i konverziju BMP ili JPG u PDF? Molim preporuku.
Isto tako me zanima da li raditi:
ocr -> pohranu teksta u bazu -> pretraživanje po tekstu za zadati pojam
ili
konverzija u PDF -> pretraživanje PDF-ova za zadati pojam
[ Markanto @ 16.10.2008. 10:14 ] @
Za prebacivanje u pdf koristi Rave!
[ Deep|Blue @ 16.10.2008. 13:54 ] @
odavno nisam koristio eztwain, tako da se toga slabije secam, proveri dal je ispraznjen bafer. probaj prvo primere koji idu uz to.
da li ocr-ujes dokumenata na engleskom ili nasem jeziku. za engleski i mogu da se nadju kontrole, ali za nase kvacice resenja su "malko" skuplja.
sto se tice ocr-a, tesko da ces za male pare naci kontrolu koja ti nudi ocr i pisanje pretrazivog pdf-a. sam upis u bazu i pretrazivanje je jednostavno.
sto se tice izbora pdf ili baza ... licno, prvo bi isao zajednicku varijantu (baza + pdf, aplikacija pretrazuje iz baze, a korisnik naknadno moze iz pdf-a) , ako ne moze to onda baza.
mada ti pdf nudi mogucnost rada bez aplikacije.
[ franjo_tahi @ 16.10.2008. 23:13 ] @
Marko, nisam razumio? Kako rave? Za ispise iz app koristim quicreport i nije problem ispisati - exportirati u pdf, radi se o dokumentima koji su scanirani u bmp ili jpg.
Što se tiče ocr-a, tu sam potpuno novi, nisam se time nikada bavio. Tekstivi su 99% na hrvatskom. Čuo sam da postoji mogučnost "učenja" raspoznavanja znakova, a k tome bi sve trebalo biti objedinjeno unutar programa koji (ću valjda) raditi.
Ručno pretraživanje PDF-ova od strane korisnika ne dolazi u obzir, radi se o nekoliko desetaka tisuća... znači ili: ocr pa tekst u blob (ili varchar) ili nekakav mehanizam automatskog pretraživanja po PDF-ovima iz programa.
[ Markanto @ 17.10.2008. 07:23 ] @
Nisam nikada imao potrebu scanirati, ali sam imao potrebu prebacivati zapise u pdf.
To sam jednostavno koristio pomocu rave-a koji dolazi sa Delphi 7.
Posto sada vidim da je tvoj zadatak ono sto nisam nikada radio (jer nisam imao potrebu) dalje
cu samo nastaviti pratiti temu jer je zanimljiva!
[ savkic @ 17.10.2008. 07:36 ] @
Najbolji put je smeštanje skeniranog sadržaja u bazu i indeksiranje svih reči (to se radi u posebnoj tabeli). Pretraga se vrši po toj indeks tabeli a sadržaj dokumenta se ili prikazuje iz Blob polja ili iz PDF (ako čuvaš već tekstove u PDFu možda je suvišno čuvati ih posebno i u bazi).
[ franjo_tahi @ 17.10.2008. 23:48 ] @
savkic, to mi je bila osnovna ideja. Još da riješim tehnikalije ...
Dakle: scan sam riješio. Napravio sam mali test programčić, radi sasvim ok.
Ostalo mi je još OCR i BMP -> PDF.
Kontrole bih kupio (ako baš ne može drugačije), ali za razumnu svotu. Vidio sam da se može nabaviti za cca 200$. Našao sam nekoliko, ali treba vremena da se testiraju.
Bilo bi dobro da je netko radio nešto slično pa može preporučiti koju kontrolu, da ne gubim vrijeme.
Budući da je to dio projekta koji još nije započet, a radim druge stvari, malo sam to pustio po strani nadajući se da ću ovdje dobiti koji konkretnij odgovor i pomoč. Vjerojatno ću za 10-tak dana početi raditi, pa ako ne dobijem do tada konkretniju pomoć, napist ću ovjde što sam napravio, moda će nekome koristiti.
Copyright (C) 2001-2025 by www.elitesecurity.org. All rights reserved.
|