[ luner @ 18.08.2002. 00:51 ] @
Vidim da se već duže vreme pominje UTF-8 kao charset za (x)html dokumente pa bih ja voleo da ovde dobijem skoncentrisane odgovore:

1. Da li je opšti utisak da će UTF-8 da postane standard za web stranice?

2. Kako se implementira UTF-8?
2.1. Kako ga koristiti u dokumetnima koji se kreiraju pod Winblowsom (da li ga Dreamweaver podržava)? (Mislim, glupo je da se pamte gomile kombinacija i ručno kucaju :))
2.2. Kako ga koristiti u dokumentima koji se kreiraju pod Linux-om? (Quanta ili tako nešto?)

3. Kako izgleda pristupanje formi koja je pod UTF-8 charsetom? (automatski se prevodi u odgovarajući kod (kao kod recimo 8859-2) ili... ?)

4. Kako prebaciti već postojeći sadržaj pod iso-8859-2 na UTF-8? (el postoji nešto lakše od prekucavanja :)) ?)

Imam u planu par većih projekata pa ne bih želeo da za jedno godinu-dve developeri shvate da je to ipak evolucijski ćorsokak ili da neki budža ispromoviše nešto drugo - ništa više ne prekucavam :))))

Pozdrav svima i hvala unapred!
[ NetworkAdmin @ 18.08.2002. 01:31 ] @
Za pocetak samo da ti kazem da UTF-8 nije kompatibilan sa ISO 8859 itd, da mozes koristiti samo ASCII karakter set i entities, na srecu UTF je kompatibilan sa ASCII

Malo je sire od onoga sto si ti pitao ali nedavno sam procitao clanak koji govori i o toj temi:
http://hotwired.lycos.com/webm...2/33/index1a.html?tw=authoring

Webmonkey zar tu nismo svi poceli?
[ random @ 19.08.2002. 00:46 ] @
Što se konverzije tiče, libiconv je rešenje, a i PHP ga podržava tako da se mogu raditi i konverzije "u letu".

Btw, pod windowsom sam koristio UltraEdit editor koji odlično podržava UTF-8.
[ tOwk @ 20.08.2002. 05:23 ] @
Kao prvo, prekucavanje nikad nije potrebno (pa ne treba brinuti oko ,,propasti'' truda), pogledaj prethodnu poruku od random-a koji daje odgovor na 2 i 4.

3. UTF-8 je filesystem-, C-strings- itd. safe, i može se neometano koristiti gde god si koristio bilo koji ISO 8859 skup znakova (ili uopšte bilo koji 8-bitni skup). Ovo je glavni razlog popularnosti UTF-8.

1. Takav je utisak, mnogi ga forsiraju, ali neki i ne (npr. IBM i IBM Internet Components for Unicode forsira UTF-16). Ipak, trenutno je najrasprostranjeniji oblik Unikod transformacije i sigurno će ostati tako bar još 3--4 godine.

2. (dodatak) Windows u potpunosti podržava Unicode (NT, 2K), a nesumnjivo se i sve aplikacije ponašaju odgovarajuće (kao i Dreamweaver).
[ tOwk @ 20.08.2002. 05:38 ] @
Citat:
NetworkAdmin:
Za pocetak samo da ti kazem da UTF-8 nije kompatibilan sa ISO 8859 itd, da mozes koristiti samo ASCII karakter set i entities, na srecu UTF je kompatibilan sa ASCII


Hm, UTF8 je transformacija Unikod skupa znakova koji je i više nego kompatibilan sa ISO 8859 skupovima (čak se npr. ćirilični simboli iz ISO-8859-5 na pozicijama od 0xA0--0xFF nalaze na pozicijama od 0x400--0x45F, mapirani 1--1, možda sam pogrešio brojeve).

Tvrdnja koja se može izneti je da UTF-8 nije analogan niti ekvivalentan ISO-8859 skupu znakova (bilo kojem), ali je Unikod nadskup svih njih.

Takođe, nije tačno da možeš koristiti samo ASCII i entities: za ovo ti ne treba UTF-8, HTML 4 podrška je dovoljna sama po sebi, i naravno ASCII 7-bitno kodiranje.

Toliko
[ Toni @ 20.08.2002. 22:22 ] @
Citat:
random:
Btw, pod windowsom sam koristio UltraEdit editor koji odlično podržava UTF-8.


Jel u njemu mogu i da se unose karakteri ili ih on samo nepokvari kao neki drugi editori.

Posto ja unosim u onom UniRed sto ga je napravio onaj esperantista i u njemu mogu da se unose utf karakteri
[ vejin @ 17.08.2005. 14:26 ] @
Ovo je tema od pre koje godine a posto sam tek sada poceo da radim na webu interesuje me dali je utf-8 i dalje dobar izbor ili ima i neko bolje resenje koje se pojavilo u skorije vreme??????????
[ noviKorisnik @ 17.08.2005. 15:13 ] @
Nezgodno je što se iskopavaju teme stare 3 ili 4 godine. Ali, kad već nije tema zaključana...

Dobar je utf-8, to da.