[ perhanNS @ 10.04.2009. 07:06 ] @
Želim da kopiram neki tekst sa pdf dokumenta koji je na ćirilici i koji mogu normalno da čitam, ali kada paste-ujem taj tekst u word ili bilo gde drugde on izgleda ovako:

"      
  
,   "      –  265.000  1991.
,  299.000  2002. 


kako da sredim taj problem?
[ momsab @ 10.04.2009. 10:51 ] @
mozda je problem do fonta
vidi koji je font u pdf-u, i ako ga nadjes negde ubaci medju fontove na svom kompu i probaj tad da prekopiras
[ perhanNS @ 10.04.2009. 12:06 ] @
99% je do fonta, jer numerički i delovi teksta na latinici budu iskopirani ok. nervira me to što mi je logično da ako mogu da prikažem tekst trebalo bi da mogu i da ga kopiram, ali to ne uspevam da uradim.

okačio sam dokument na rapid jer ne mogu da se setim odakle sam ga skinuo, pa ako je nekome izazov da ovo reši može da proba.
http://rapidshare.com/files/21...ekonomskog_razvoja137.pdf.html
[ momsab @ 10.04.2009. 12:41 ] @
jesi li uospte pogledao detaljnije podatke o pdf-u?
u Adobe Reader-u to je Properties pod File

videh fontove: Helvetica, Times Roman i neki TTE1* fontovi na koej tipujem da predstavljaju problem ili mozda Helvetica sa Custom Encoding
[ Slobodan Trebovac @ 10.04.2009. 12:51 ] @
Mozes to bez problema da odradis preko ABBYY FineReader-a (programa za OCR, potrazi na ES-u vise o njemu).
[ perhanNS @ 10.04.2009. 13:17 ] @
Izgleda da je ABBYY FineReader najelegantnije rešenje za ovakav tip problema.

Slobodane, hvala puno za odgovor i više od toga. Uštedeli ste mi nekoliko sati života jer sam se već spremio za prekucavanje.
[ calexx @ 10.04.2009. 17:42 ] @
Ja bih pre rekao da je Abbyy FR poslednje rešenje, ako nema elegantnijih. Pravo rešenje bi bilo da se iz dokumenta izvuku konkretni fontovi i jednostavno instaliraju ili da se od onog ko je ovo pravio dobiju fontovi. Možda da se dokument otvori nekim programom koji može da promeni fontove pa da se zamene nekim standardnim.
Ako Abbyy FR ne odradi posao, možda da pogledamo nešto od ovoga?

Pretpostavljam da su u dokumetu zbog neke zaštite i korišćeni ovakvi bezvezni fontovi jer mi liče na najobičniji Times New Roman sa sve ruskum italik slovom t. Ili je to pravio neko ko se u fontove razume taman toliko da misli da je krajnji domet što on ima hiljadu najlepših yu fontova.
[ X Files @ 10.04.2009. 18:09 ] @
Nedavno sam imao slican problem:
http://www.elitesecurity.org/t348070


ABBY 9.0c je izvrsio prepoznavanje sa tacnoscu od valjda 100% uspeha. Tako je to kad su slova jasna i precizna, tj. elektronska, pa makar bila i slika ;)