[ sekvoja @ 04.11.2007. 18:46 ] @
Pozdrav svima. Kada parsujem neki sajt sa snoopijem tekst se lepo vrati ali se strani karakteri tipa Å ä Ö prikazuju u nekom cudnom obliku. Recimo ü se prikaze kao ü. Jel neko imao slican problem? |
[ sekvoja @ 04.11.2007. 18:46 ] @
[ 1r0nM4n @ 06.11.2007. 09:28 ] @
Verovatno treba da promeniš encoding na UTF-8 ako je to moguće.. Ovaj karakter " ü " je u stvari " ü " ali zapisan na drugi način.
p0z [ Miroslav Ćurčić @ 07.11.2007. 11:18 ] @
Snupi ne vrši nikakvu konverziju sadržaja preuzete stranice, pa problem traži u kasnijem kodu.
[ sekvoja @ 08.11.2007. 06:39 ] @
Encoding i jeste utf-8. To vidim kada isprintam header.
Sto se tice kasnijeg koda tu nema greske, kakva bi to greska mogla biti? Parsujem sajt i echujem tekst iz array-a... Hvala na odgovorima ali prolem je i dalje aktuelan, poz... [ Miroslav Ćurčić @ 09.11.2007. 07:20 ] @
Probaj da ehuješ izlaz iz snupija pa uporedi sa originalom kad ga otvoriš iz browsera, dali se razlikuju ?
Daj nam link. [ sekvoja @ 09.11.2007. 17:56 ] @
Kada echujem array dobijem isto te kvazi-karaktere.
A kada otvorim sajt normalno onda je sve ok. Trenutno ne mogu ostaviti link jer snoopy koristim samo za editovanje sajta, dakle moras biti ulogovan kao administrator da bi to video. Nisam nista menjao u klasi osim sto sam stavio odredjeni link. Evo ga header ako nesto znaci: 0: HTTP/1.1 200 OK 1: Connection: close 2: Date: Fri, 09 Nov 2007 17:53:38 GMT 3: Server: Microsoft-IIS/6.0 4: X-Powered-By: ASP.NET 5: X-AspNet-Version: 2.0.50727 6: Set-Cookie: ASP.NET_SessionId=ic2ixa45rmjegdjas34alg55; path=/; HttpOnly 7: Cache-Control: private 8: Content-Type: text/html; charset=utf-8 9: Content-Length: 77849 [ sekvoja @ 11.11.2007. 14:51 ] @
Pa zar niko ne zna nista o ovome???
[ Miroslav Ćurčić @ 12.11.2007. 08:52 ] @
Potrudi se malo,
izvuci problematično parče koda u izdvojen skript i postavi ga ovde, daj nam link do stranice s koje čitaš podatke, pomozi nam da ti pomognemo. [ sekvoja @ 12.11.2007. 14:45 ] @
Ne znam koje je parce koda problematicno pa sam uploadovao
ceo snoopy kod. Sta cu kad nisam php guru. :) Nebitno je koji je sajt u pitanju, uvek je isti problem. Samo treba pokrenuti na serveru autoupdate.php iz attachmenta da bi se video problem. Tu je i link stranice koju parsujem. Hvala na pomoci... [ Miroslav Ćurčić @ 12.11.2007. 19:13 ] @
Probao skript i radi encoding kako treba,
tj. ne menja ulazni encoding pa su "egzotična" slova uobičajno prikazana s dva karaktera, ne bi ni valjalo da je drugačije (kad su već škrtarili na bitovima kad su pravili ASCII). Dakle ti i treba da dobiješ ponegde dva karaktera, tako da mi se čini da tvoja, rezultujuća stranica nije u UTF8 encodingu. Da jeste sam browser bi ti spojio te dvoslovne u jedan karakter a ti ne bi ni primetio. Zaključak, postavi UTF8 meta tag u zaglavlje rezultujućeg HTMLa, a ako sajt mora biti u nekom drugom encodingu ne gine ti konverzija. [ sekvoja @ 12.11.2007. 21:39 ] @
Neverovatno je koliko covek moze da se cima oko neke gluposti.
Sta cu kada nemam dovoljno iskustva sa php-html-mysql i slicnim stvarima. I bio si u pravu. Moja rezultujuca stranica je bila iso-8859-1 a ne utf-8 i to je bio problem. Ko zna kada bi se ja sam setio to da proverim. Hvala puno na pomoci!!! [ Miroslav Ćurčić @ 12.11.2007. 22:59 ] @
1r0nM4n ti je odmah skrenuo pažnju na to (bar sam ga ja tako shvatio), ali si nas zabrinuo s onim "Encoding i jeste utf-8" pretpostavljajući da si proverio oba.
![]() Copyright (C) 2001-2025 by www.elitesecurity.org. All rights reserved.
|