[ nezki @ 23.06.2007. 21:17 ] @
Imam problem prilikom citanja sadrzaja koji je pisan cirilicom iz jednog .doc fajla i prilikom njegovog upisa u bazu i html fajl.
Problem nastaje kada taj procitani sadrzaj upisem u html fajl i kada ga pokrenem dobijem nebulozne karaktere.
Isto se desava kada taj procitani sadrzaj upisem u bazu pa ga posle opet prikazem na nekoj stranici dobijem nebulozne karaktere.
Probao sam nesto sa funkcijama utf-encode i decode ali ne ide.
Da li neko moze da mi pomogne,evo uploadovao sam skriptu help.php koja bi trebalo to da radi.
[ hatebreeder @ 24.06.2007. 03:41 ] @
Nisam potpuno siguran al mislim da ono sto ti treba je utf8_decode i utf8_encode pa se poigraj sa tim imas detaljno na php.net
[ nezki @ 24.06.2007. 08:26 ] @
Vec sam probao sa utf-encode i utf-decode.Stavio sam da string koji je sadrzaj iz word dokumenta koji citam utf-encoderan (utf-encode($procitani sadrzaj)) , a posle kada ga upisujem u html fajl stavio sam da upisujem utf-decodiran,(utf-decode($procitani sadrzaj)) ali opet ne radi.
[ nezki @ 24.06.2007. 22:02 ] @
Da li je moguce da nije niko imao ovakvih problema? (:
[ hatebreeder @ 24.06.2007. 22:35 ] @
A da pretpostavimo ono najgluplje da fajl ima delove koje su hijeroglifi a delove u default php encodingu... Mozda ne mora sve da se encoduje vec samo delovi izmedju nekih tagova
[ nezki @ 24.06.2007. 22:54 ] @
Nije to u pitanju cist je doc fajl

isti problem imam i kada citam sadrzaj iz nekog html fajla
[ Nebojsa_S @ 25.06.2007. 09:49 ] @
Mislim da je problem u tome sto je .doc fajl binarni , a ne ASCII ( odnosno plain/text ) fajl. Ako imas pristup tom fajlu, probaj da ga prvo snimis kao RTF ili HTML, pa da onda nesto s njim radis. Cini mi se da nema jednostavnog resenja
[ nezki @ 29.06.2007. 22:57 ] @
Da li uopste neko zna da li se u php-u moze citati .doc fajl, ili da li postoji neki nacin da ga konvertujem u txt ili html fajl?Ja sam probao da procitam bilo koji doc fajl ali ne ide jer dobijem gomilu nekih nebuloznih znakova.
[ kelja @ 29.06.2007. 23:22 ] @
Moze.
http://www.drewd.com/index.php/?p=151

Da, da napomenem- ovo ce raditi samo na windows serverima :(

[Ovu poruku je menjao kelja dana 30.06.2007. u 01:02 GMT+1]
[ nezki @ 30.06.2007. 00:54 ] @
RESIOOOOO SAM PROBLEM!!!! :) :) :)
Ipak dok se sam ne pomucis i procitas sve moguce naslove na Google vezane za ovu temu nista:)
Ipak hvala svima jer ste mi takodje i vi dosta pomogli.
Evo ukratko cu napisati resenje,
Ovako je glasio moj problem:
Trebalo mi je da gomilu word fajlova konvertujem u html fajlove, a da problem bude jos gori u word dokumentima je sadrzaj pisan cirilicom.
Moja ideja je bila da obidjem ceo folder sa doc fajlovima procitam ih i upisem u html fajlove sa pauzama kako ne bih presisao max_execution_time.Medjutim tu sam naisao na problem jer doc fajl je binarni , a ne ASCII ( odnosno plain/text ) fajl.
Onda sam nasao na netu adresu za ono sto meni treba http://freedownloadmanager.org...mp;search_btn=Search+%3E%3E%3E
(es ce je skratiti) na kojoj mozete naci klasu za konvertovanje doc2txt ali nazalost ne radi.
Takodje sam nasao jos jednu klasu koju mi je kelja dao http://www.phpclasses.org/browse/package/388.html?download=zip
ali i ona radi u 1% sasvim ispravno a u ostalih 99% ne radi bas ok jer radi jako sporo i onda se upit prekida posle 30 s.Pokusao sam da je ispravim ali ne ide.
I na kraju sam uspeo da resim problem tako sto sam na adresi http://www.softinterface.com/C...atures/Convert-DOC-To-HTML.htm gotov program za konvertovanje koliko hocete i kojih hocete fajlova.
Medjutim i njemu fali to sto kada konvertujete na primer doc u html on vam nalepi jos gomilu stilova, pa sam ja napravio zakrpu za njega i to resio, tako da sada sve radi sasvim ok da ne moze biti bolje, ako nekom treba zakrpa (nije bas idealna ali radi ok) nek se javi.
Jos jednom hvala svima.
Poz