[ berekin @ 04.05.2003. 18:34 ] @
Zna li neko za kvalitetan konverter .pdf u ascii ili html a da radi pod linuxom u terminalskom rezimu? Probao sam pdftohtml ali je sadrzaj koji se dobije kao rezultat konverzije dosta loseg kvaliteta (slova su neprimjereno velika,dosta slova se uopste ne vidi,brlja pisma itd..).
[ Dusan Marjanovic @ 04.05.2003. 23:13 ] @
možda pdf2ps pa ps2ascii
[ random @ 05.05.2003. 04:57 ] @
Valjda i ps2ascii može da čita pdf...
[ tOwk @ 05.05.2003. 20:12 ] @
Citat:
berekin:
Zna li neko za kvalitetan konverter .pdf u ascii ili html a da radi pod linuxom u terminalskom rezimu? Probao sam pdftohtml ali je sadrzaj koji se dobije kao rezultat konverzije dosta loseg kvaliteta (slova su neprimjereno velika,dosta slova se uopste ne vidi,brlja pisma itd..).


Hm, HTML lošeg kvaliteta? Pa veličina slova zavisi od tebe i tvog čitača, pošto HTML to ne definiše. Usput, o ovome je neprimereno mnogo raspravljano, a ja ću još jednom ponoviti: apsolutnu tačnost nije moguće postići pomoću programa koji čitaju PDF, a najbolje rezultate mogu dati OCR programi.
[ Gojko Vujovic @ 05.05.2003. 20:33 ] @
HTML svakako može da definiše i tip i veličinu slova, t0wk.
[ tOwk @ 06.05.2003. 16:40 ] @
Ok, ti koji me stalno nazivaš tNulawk.

HTML pre 4.0 Strict može da definiše tip i veličinu slova (Strict ne može, kao što sigurno znaš, a to je jedini i pravi HTML ;-), ali sumnjam da pdftohtml to radi. A to je bitno za ovu raspravu, ne, naročito pošto svi znamo da je izbacivanje <FONT> oznaka iz HTML-a jedan „sed“ daleko, a pozivanje drugog CSS-a je još bliže (ako se on koristi).