[ Miroslav Jeftić @ 18.03.2010. 18:56 ] @
Tema je možda neobična za ovaj deo foruma, ali ipak bih voleo da čujem neko mišljenje na temu. Naime, radim kao prevodilac i povremeno dobijem da prevedem katalog, brošuru, prospekt ili nešto slično. Obično mi takve fajlove šalju u PDF formatu; da bih to mogao da prevedem, obično moram taj PDF da prebacim u neki format koji se može menjati, najčešće tako što uradim OCR i onda ga pošaljem u Word. Posle ga ili isporučim kao Word ili ga ponovo vratim u PDF.

Problem je što to nekad bude (mislim na izgled konačnog dokumenta) sasvim pristojno, a nekad izgleda kao da je bomba bačena u Word dokument, tj. ako ima puno tabela, slika ili slika u tabelama ceo sadržaj se bukvalno "razleti" po dokumentu. Nekako sve to na kraju namestim, ali zahteva puno vremena i izgubljenih živaca dok se napravi da koliko-toliko liči na nešto. Da ne pominjem da slike i boje budu i muljave i kao isprane u odnosu na original. S druge strane, ne verujem ni da bi mi odgovaralo da imam nekoliko različitih DTP programa na računaru, em što nisu jeftini, em verovatno da nisu ni pogodni da se direktno u njima prevodi.

Zanima me da li postoji neki jednostavniji način za sve to, tj. da li se iz DTP programa može (čist) tekst nekako izvesti (npr. u doc, html, xml ili nešto slično) kako bih ga ja mogao prevesti u programu za obradu teksta i da posle toga ponovo vrati nazad? Odnosno da li postoji neki "best practice" za takve slučajeve? Hvala~
[ koska @ 18.03.2010. 20:24 ] @
Nazalost, tih problema je uvek bilo. Ja za te stvari povremeno koristim Abbyyevo resenje i muku mucim sa silnim text-boxovima koji nastaju posle konverzije, kao i lose prepoznatim fusnotama. Ne radim to tako cesto, tako da nisam isprobao druga resenja (ako ih uopste i ima).

Probaj sa nekim online OCR konvertorom, mozda i iznenade :)
[ Miroslav Jeftić @ 18.03.2010. 20:59 ] @
Ne verujem, ja takođe radim sa Abbyy-jem, sve ostalo mu nije ni prineti. Bar ono što sam do sada isprobao. Izgleda ništa od nekog zeca iz šešira, nažalost.
[ skemamen @ 19.03.2010. 11:10 ] @
Jedno od pametnih resenja za editovanje teksta u PDF-u je "Pit Stop Professional", naravno ukoliko tekst nije u krivama...
[ Miroslav Jeftić @ 19.03.2010. 23:31 ] @
Hm... šta su tačno krive? Hvala na predlogu, pogledaću u svakom slučaju.
[ Skandy @ 20.03.2010. 01:58 ] @
Tekst pretvoren u kriveje je graficki termin, a odnosi se na tekst koji je pretvoren u vektorski objekat i koji kao takav ne moze vise biti promenjn u drugi font. Takogdje on gubi neke svoje osobine koje je posedovao dok je bio u fontu.
OCR programi bi trebalo da savrseno prepoznaju tekstove u krivama, jer su takvi tekstovi mnogo boljeg (citljivijeg) kvaliteta od skeniranih.