[ maxer @ 29.12.2008. 11:01 ] @
Interesuje me kako plejeri (MV2 Player) prepoznaje na kom je jeziku napisan titl iako u imenu fajla ne pise nista o tome , jel' postoji neki tag ili slicno u samom .srt, .sub,... fajlu?
[ Cileinteractiv @ 29.12.2008. 17:57 ] @
Mislim da on ni ne može da ih prepozna. Korisnik određuje kako će plejer tretirati titl, kao East European... ili nekako dugačije.
[ maxer @ 12.01.2009. 11:33 ] @
Nisam na to mislio. MV2 Player u gornjem delu uvek ispisuje ser, cro, eng i sl., u zavisnosti od ubacenog titla. Kako dobija te informacije kad u imenu fajla nista o tome nema.
[ Cileinteractiv @ 18.01.2009. 11:27 ] @
Aha, e pa ni ja to ne znam. Nadam se da ce nam neko objasniti to...
[ mulaz @ 18.01.2009. 12:32 ] @
Probaj u notepadu da otvoris titl, i pretrazi malo, mozda negde u zaglavlju pise jezik
[ maxer @ 20.01.2009. 18:26 ] @
Ma nema, provereno. On se nalazi ili na pocetku ili na kraju ako postoji. U .sub i .srt odma' krecu od 1. titl itd.
[ Mister_rap @ 24.01.2009. 14:03 ] @
Kako tacno Mv2 radi nisam siguran.
Najvjerovatnije je baziran na encoding-u texta jer vecina algoritamaza language detection upravo koristi tu tehniku.

[ maxer @ 25.01.2009. 18:13 ] @
Ne znam. Ako tako radi, kako onda pravi razliku izmedju srpskog i hrvatskog tj. .ser i .cro.
[ Mister_rap @ 25.01.2009. 22:12 ] @
Po istom principu, plus to uvijek i neradi kako bi trebalo.
Skini neki .cro i .ser titl i probaj da .ser pejstujes u .cro i obratno.

Mv2 nece prepoznati razliku...
[ maxer @ 25.01.2009. 23:02 ] @
Da, izgleda da je tako. Hvala.
[ Mister_rap @ 25.01.2009. 23:14 ] @
Nista i drugi put
[ Stranger2 @ 04.02.2009. 13:39 ] @
Mislim da se dosta jezika moze prepoznati po slovima koji su upotrebljani.
na primer engleski jezik koristi slova XYWQ
srpski i hrvatski ŠĐČĆŽ
grcki koristi alfa, beta, omega...
nemci imaju one kukice..
ruski ima jedinstvenu verziju cirilice..

u kombinaciji sa prepoznavanjem encodinga, pretpostavljam da to verovatno i nije tako tesko

Koliko se jezik moze prepoznati na osnovu upotrebljenih slova sigurno znaju oni koji se bave lingvistikom, arheologijjom ili necim slicnim... na forumu Nauka mislim da sam video jednu TOP temu o tome pa mozes pogledati ili pitati ako te zanima.
[ Mister_rap @ 04.02.2009. 16:22 ] @
Slova su nebitna u ovom slucaju jer imas brdo "domacih" titlova koji nemaju niti jedan nas karakter...
Algoiritmi (u ovom slucaju) se baziraju na prepoznavanju encodinga!
[ Stranger2 @ 05.02.2009. 02:36 ] @
pa dobro ako domaci titl nema domacih slova onda to nije ispravan subtitl. oonda ne mozemo ni ocekivati da ce ga prepoznati.

inace, bas ovih dana sam prekopavao po gomili fontova u programu MainType i tabele karaktera sa oznacenim encodingom su mi bile pred ocima sve vreme. Nema ih toliko puna a vidljivo je da ima mnogo specificnih karaktera zato mislim da je prepoznavanje samo na osnovu enkodinga prilicno tesko.