[ tibor @ 07.04.2005. 13:46 ] @
Cini mi se kao cest problem ali nisam uspeo da nadjem nista korisno na ES-u o ovoj temi. Imam sajt koji je latinican a voleo bih da mu dodam i cirilicnu verziju. Da li postoji neki skript koji ucitava izgenerisanu latinicnu stranu i zatim je prevodi u cirilicnu?
[ Gojko Vujovic @ 07.04.2005. 13:49 ] @
Nikako, pošto promena iz latinice u ćirilicu nije jednoznačna. U različitim rečima slova koja u latinici čine dva karaktera, u ćirilici nekad postaju jedan a nekad ostaju dva odvojena.

Obrnuta promena je moguća jer promenom iz ćirilice u latinicu nema ovakve dileme - svako slovo ima ekvivalent u latinici, bilo dvoslovni (nj) ili jednoslovni poput š,ć...
[ broker @ 07.04.2005. 14:14 ] @
Potrazi na netu program Vucko. On radi taj posao. Predvidjen je pre svega za offlinekonverziju ali mozes da ga natociljas da radi i kao cgi ili tako nesto uletu.

U svkaom slucaju, mnogo ce ti biti lakse da sajt napravis u cirilici a onda ga konvertujes u latinicu.

[ Not now, John! @ 07.04.2005. 14:17 ] @
Ni konverzija ćirilice u latinicu nije jednoznačna. Na primjer, slovo Dž (ćirilično) nekad može biti Dž ili DŽ. Isto je sa svim "dvoznačnim" slovima.
[ broker @ 07.04.2005. 14:25 ] @
Uz neka dodatna pravila, moze se svesti na jednoznacnu konverziju bez problema.

Na http://ult.datavoyage.com/ imas free PHP bilbioteku koja omogucava laku konverziju iz cirilice u latinicu.
[ tibor @ 07.04.2005. 16:07 ] @
hvala brokeru
&
pozdrav
od Tibora freebikera
[ --SOULMaTe-- @ 07.04.2005. 19:28 ] @
Citat:
Not now, John!: Ni konverzija ćirilice u latinicu nije jednoznačna. Na primjer, slovo Dž (ćirilično) nekad može biti Dž ili DŽ. Isto je sa svim "dvoznačnim" slovima.


Pa koliko ja znam slovo dž se cirilicom pise iz jednog slova dž, tako da jeste jednoznacno.
[ Not now, John! @ 07.04.2005. 22:00 ] @
Citat:
--SOULMaTe--: Pa koliko ja znam slovo dž se cirilicom pise iz jednog slova dž, tako da jeste jednoznacno.

Nisi me razumio. Gojko je rekao da je promjena cir->lat jednoznačna, ali nije, pošto velikom ćiriličnom slovu Dž, odgovara latinična kombinacija DŽ i Dž. Dakle, ako napraviš neki algoritam za promjenu cir -> lat može ti se desiti sljedeće, u zavisnosti kako implementiraš algoritam.
DŽelat ili DžELAT
[ u_m @ 07.04.2005. 23:03 ] @
Citat:
Not now, John!:može ti se desiti sljedeće, u zavisnosti kako implementiraš algoritam.DŽelat ili DžELAT


Pa to kao da si rekao da ni A nije jednoznacno je moze biti Auto i aUTO

ako je veliko slovo onda izaberes ili DŽ ili Dž kako ti se vise svidja i od tad je jednoznacno
[ broker @ 07.04.2005. 23:59 ] @
Citat:
u_m:
ako je veliko slovo onda izaberes ili DŽ ili Dž kako ti se vise svidja i od tad je jednoznacno


Ispravno je DŽUNGLA, džungla i Džungla, zavisno od situacije ali DŽungla i DžUNGLA nije ispravno.

U gore pomenutoj PHP biblioteci je to reseno tako sto se proverava da li je prvo slovo iza dž veliko ili malo pa se na osnovu toga konvertuje i slovo dž. Mogu da zamislim nele situacije gde može da dodje do pogresne konverzije (primer: DŽ u n g l a, zahvalite Gojku što ne možemo da napišemo ćirilične primere da bi bilo jasnije).

[ gpreda @ 08.04.2005. 08:47 ] @
Kod automatske konverzije se javljaju i drugi problemi, npr. neki delovi teksta moraju da ostanu napisani latinicom (rimski brojevi, engleske reci), tako da se u tekstu mora posebno oznacavati sta se prevodi a sta ne.

Zato je najlakse postaviti posebne markere u tekst i napisati PHP skriptu koja ce ih prepoznavati i vrsiti konverziju. Takodje, mogu se dodati i dodatne oznake koje bi premostile nejednoznacne probleme pri konverziju.

Ja sam neke od ovih stvari implementirao na svom sajtu, pa koga zanima moze da pogleda. Iz mog iskustva, bolje je originalan tekst napisati na latinici (ne koristi se unicode, nemam problema ni sa jednim editorom, manje mesta zauzima u bazi) i kasnije prevoditi u cirilicu.
[ broker @ 08.04.2005. 12:16 ] @
Citat:
gpreda: Kod automatske konverzije se javljaju i drugi problemi, npr. neki delovi teksta moraju da ostanu napisani latinicom (rimski brojevi, engleske reci), tako da se u tekstu mora posebno oznacavati sta se prevodi a sta ne.


Oaj problem u ULT nisam rsio i to samo iz jednog razloga - ne vladam regexpom dovoljno da bih znao kako to da izvedem. Ako si raspolozen da podelis malo koda... ih :)

[ gpreda @ 09.04.2005. 14:51 ] @
Pogledao sam malo ult (mada se nisam mnogo udubljivao) i cini mi se da smo koristili slicne ideje. Ja sam multilanguage na mom sajtu radio na sledeci nacin:
- za svaki jezik imam jedan resource fajl (recnik)
- html (php) fajlove gradim tako sto umesto teksta stavljam
transl ($key, $lang, $enc, $force)
$key je kljuc koja recenica se uzima iz resursa
$lang je jezik
$enc je encoding (na primer cirilica ili latinica za srpski)
$force je boolean, da li se forsira default encoding (na primer da neke recenice i u cirilici ostanu napisane latinicom)

Nisam ovo mnogo razradjivao, ali mi se cini kao jednostavna ideja koja mi je bila sasvim dovoljna da lako napravim multilanguage stranice za bilo koji broj jezika (imam na primer stranice koje podrzavaju engleski, francuski, latinicu i cirilicu).

Citat:
broker: Oaj problem u ULT nisam rsio i to samo iz jednog razloga - ne vladam regexpom dovoljno da bih znao kako to da izvedem. Ako si raspolozen da podelis malo koda... ih :)


Ako imas konkretnu ideju sta zelis da dodas u ULT, a ne znas kako to da realizujes sa regexpom, pomoci cu ti.