[ Slobodan čovek @ 07.07.2014. 17:31 ] @
Kako u Ubuntu-u 12.04.4 prebacim titlove za filmove sa latinice na ćirilicu, a da ne dođe do raznih poremećaja?

Tražim, dakle, program koji ovo radi.

[Ovu poruku je menjao Slobodan čovek dana 08.07.2014. u 15:29 GMT+1]
[ jablan @ 08.07.2014. 12:51 ] @
Ne može se jednoznačno prevesti tekst iz latinice u ćirilicu. Posebno ako je korišćeno dj umesto đ.

Inače, kad bih ja pisao skriptu za preslovljavanje išao bi sledećom logikom:

prvo konvertovati tekst iz 8-bitnog rasporeda u UTF-8 (mislim da je većina domaćih titlova u windows-1250)
drugo konvertovati digrafe "nj", "lj" i "dž" u odgovarajuće karaktere iz unicode (komanda sed)
treće, translirati karaktere iz latinice u ćirilicu (komanda tr ili ponovo sed)
[ Slobodan čovek @ 08.07.2014. 13:01 ] @
Ne razumem zašto ne može. Recimo na ovom sajtu može: http://www.mikroknjiga.rs/cir/index.php
Ali kada to (ćirilični tekst) iskopiram nazad u titl i pustim film, izbacuje neke nepoznate karaktere.

Zar ne postoji ni jedan progam, specijalizovan za titlove, koji ovo radi? Može i za Windows ako nema za Linuks.
[ bojan_bozovic @ 08.07.2014. 13:17 ] @
Skini notepad++ snimi titl kao UTF8, pa probaj konverziju ne sa tog sajta, već na http://www.konvertor.co.rs/ copy/paste u notepad++ pa snimi kao UTF8.

http://notepad-plus-plus.org/

Rezultat je evo ovde http://pastebin.com/7vYdBX2L (ne znam zašto forum reenkodira txt fajl). Bag u forumu - da, forum UTF8 tekst prijavljuje browseru kao Win-1251.
[ Slobodan čovek @ 08.07.2014. 13:28 ] @
Ništa. Isti rezultat. Sačuvao sam kao UTF8 sa uređivačem teksta (onim što se dobija uz Ubuntu).
[ bojan_bozovic @ 08.07.2014. 13:30 ] @
Čekaj malo, da li na sajtu konvertor.co.rs dobijaš ćirilicu kao izlaz u desnom polju, kad u levo ubaciš tekst na latinici? Za mene radi, evo još jednom!

http://pastebin.com/dtBKNw2L
[ Slobodan čovek @ 08.07.2014. 13:36 ] @
Dobijam, kao i na onom sajtu koji sam ja naveo. Ali kada taj ćirilični tekst ubacim u titl fajl (umesto latiničnog) i pustim film, na filmu su titlovi prikazani nekim nepoznatim karakterima.
[ bojan_bozovic @ 08.07.2014. 13:39 ] @
Koji plejer koristiš? Snimi titl različitim enkodinzima, dok ne vidiš koji radi (programeri umeju da budu aljkavi). Probaj UTF8, Win-1251 i 8859-5 enkodinge.
[ Slobodan čovek @ 08.07.2014. 13:52 ] @
Sada probam na VLC-u a inače koristim (na drugom računaru) XBMC. Podesio sam sad VLC da mu titlovi budu UTF8. Sada prikazuje isto što i dobijam na tom sajtu za konvertovanje.

Ali ima drugi problem. Neka slova u originalnom titlu (latiničnom) su ispisana drugim karakterima, ali kada se film pusti ona se prikažu kako treba, obično. Kada se to prebaci na ćirilicu i pusti film, ti karakteri nisu prevedeni, ako me razumeš.

Primer:

Broj žrtava raste iz èasa u èas

Kada se film pusti, on prikaže titlove kako treba (kada je VLC podešen na "normalno" podešavanje, na UTF8 prikazuje "?" za te karaktere):

Broj žrtava raste iz časa u čas

Ali kada prebacim na ćirilicu, onda ne prikazuje kako treba (bilo UTF8 ili windows-1251 (ćirilica)):

http://www.dodaj.rs/f/S/P1/309bxoPE/titlovi.png

[ bojan_bozovic @ 08.07.2014. 13:59 ] @
Da li u latinici, na konvertor.co.rs kad uradiš copy/paste vidiš šđčćž? Ako ne, snimi latinicu prvo kao UTF8
[ plus_minus @ 08.07.2014. 14:02 ] @
Kako ovaj radi ?

Preslovljavanje srpskog jezika
[ bojan_bozovic @ 08.07.2014. 14:03 ] @
Radi za mene i taj. Samo copy/paste iz notepad++
[ Slobodan čovek @ 08.07.2014. 14:03 ] @
Nije to problem, već sami titlovi koje skinem sa interneta. Oni su na latnici, i umesto "ć" stoji neka kocka, recimomo, ili šta ja znam. To se prepozna u plejeru i prikaže se kao "ć" (ako se plejer podesi dobro).

Nemam živaca više da se zezam sa ovim i da objašanjavam (nekoliko puta sam rekao da ti sajtovi rade, a da je problem nešto drugo). Ako neko zna za neki program koji ovo radi neka mi da link. To sam, u stvari, i hteo. Ako nema, niša...
[ jablan @ 08.07.2014. 17:26 ] @
Ovako.

Titlovi koje skineš sa neta su verovatno u Windows-1250 kodnom rasporedu. Prvo ih moraš konvertovati u UTF-8.

Ovo možeš gedit-om (ideš na Open, pa selektuješ dole Windows-1250 kodni raspored), pa kad učitaš (videćeš karaktere ok), snimi kao UTF-8.

Možeš i sa

Code:
iconv -f WINDOWS-1250 -t UTF-8 ime_fajla.srt -o konvertovani_fajl.srt
[ Slobodan čovek @ 08.07.2014. 17:34 ] @
Sačuvam ih ja kao UTF-8, ali džaba. Nema veze. Zaboravite na ovu temu. Shvatio sam da se više isplati sat vremena tražiti odgovarajući titl (dakle na ćirilici) nego trošiti živce na prepravljanje neodgovarajućih (latiničnih).

Nego, da ne otvaram novu temu. Kojim programom mogu da ubacim titl fajl u video fajl (tako da imam samo video fajl, umesto i video i titl fajl), bez transkodovanja (da ne moram da čekam 2 sata transkodovanje samo da bih ubacio titl)?
[ jablan @ 08.07.2014. 17:49 ] @
Za drugo pitanje otvori novu temu.

Za prvo pitanje: evo sam se iscimao napravio ti sed skriptu za konverziju latinice u ćirilicu.

Koristiš je na sledeći način:

Code:
sed -f lat2cir.sed ime_latinicnog_fajla


Napomena je da skripta očekuje ulazni fajl u UTF-8 rasporedu, dakle pre sed moraš da izvršiš iconv iz prethodne poruke koji sam ti dao.

To je sve u svemu 15 sekundi posla.

Možeš i da uvežeš dve komande na sledeći način

Code:
iconv -f WINDOWS-1250 -t UTF-8 latinicni_fajl.srt | sed -f lat2cir.sed > cirilicni_fajl.srt


Ne može lakše da ga jebeš.
[ Slobodan čovek @ 08.07.2014. 18:03 ] @
Hvala. A novu temu neću da otvaram jer iz iskustva znam kakve ću odgovore dobiti (tipa: Avidemux ili Handbrake, iako sam napomenuo da ne tražim to...).
[ mihojla @ 09.07.2014. 04:57 ] @
Evo jednostavan javaskript program manji od 2KB koji prebacuje i Dj u Đ
[ Slobodan čovek @ 09.07.2014. 07:07 ] @
Hvala.
[ agvozden @ 09.07.2014. 14:41 ] @
najbolji test da li radi pravilno iz latinice u ćirilicu jeste "tanjug", "injekcija" i "windows xp"
ako ovo prođe ima šanse za takav program...

i sam sam odavno pravio sličan servis http://www.gvozden.info/alati/latcirconv.php , ali me mrzelo da ubacujem specijalne termine...
ipak sam morao da dodam utf8 i još uvek nezaboravljeni yuscii