[ madman @ 12.02.2002. 12:46 ] @
Nisam sigurna da li je ovo pravi forum. Ali bi voleo da pokrenem raspravu o Srpsko-Engleskom prevodiocu. Pre nekoliko meseci, pokuso sam sa nekim ljudima iz ovog foruma da prevedem dokumentaciju PHP na srpski jezik, ali posto ima dosta teksta a malo dobrovoljaca, na kraju se to ugasilo. I po meni ispostavilo se da treba krenutni od srzi problema tj. pravog prevodioca sa kojim bi mogli da prevodimo svaki tekst.
A na osnovu onoga sto sam vido na ovom forumu, ima dosta pametnih ljudi.Osim toga mnogi su pokusavali da naprave prevodioc(npr Rusi i neki nasi), ima na net-u dosta varijanti ali su to prevodioci (citaj recnici) koji prevode rec po rec bez ikakvog gramatickog smisla. Sada bi bilo dobro ,po meni, raspraviti (ili dati ideje) na koji nacin moze da se napravi algoritam za prevod. Tu bi trebalo ukljuticiti i lingviste i programere. Zeleo bi da cujem vasa misljenja o pokretanju ovake rasprave, pa mozda da se otvori i novi forum na ovom sajtu vezan za tu tematiku.
Jer ipak prevodioc (pravi) bi promenio sliku IT kod nas. Jer bi i ljudi koji neznaju Engleski mogli da koriste komp i internet sa vecom lakocom. Osim toga verujem da i odredjene susedne zemlje bi imale koristi od ovoga. Pa bi bilo lepo da svi koji mogu doprinesu raspravi i predlaganju pravca i nacina, metodologije zapocinjanja ovog projekta.
[ Dragi Tata @ 12.02.2002. 16:24 ] @
Pošto trenutno radim u firmi koja se bavi kompjuterskim prevodom teksta (Machine Translation, kako oni to zovu), mislim da bi bilo dobro da kažem koju reč o tome.

Elem, ovde se programi za prevođenje teksta razvijaju 10 godina. Srž razvojnog tima čine ljudi koji su specijalizovani za tzv Computational Linguistics - dakle dobro poznaju i lingvistiku i programiranje. Naravno, ima i običnih lingvista koji sastavljaju rečnike, pravila, itd, a postoji i inženjersko odeljenje (u kome ja radim) koje se bavi izradom softvera nevezanog za sam proces prevođenja (razni filteri za konverziju dokumenata, itd). Ko želi da pogleda šta smo na kraju dobili, neka pogleda

http://itranslator.mendez.com

Daleko od savršenog, zar ne? Napominjem da je ovo rezultat 10-godišnjeg rada velike ekipe ljudi.

Najzad, pogledajte reklamu za jedan hrvatski prevodilac:

http://www.tranexp.hr/

Naravno, primer koji su oni prikazali je pažljivo odabran da navede potencijalnog mušteriju na kupovinu.
[ madman @ 12.02.2002. 17:07 ] @
Na tom sajtu (ne na hrvatskom) su samo zapadni jezici.
Zato sam i postavio ovu temu, da se vide i cuju misljenja ljudi, a ko zna mozda i nekad uspemo da sastavimo tim.
Jedini je problem sto je nas jezik jos slozeniji od ovih zapadnih.
pa to predstavlja problem, ali verujem da je to izazov. Koji ako se resi, predstavlja veliki uspeh.
Jos nesto ovaj hrvatski je zatvorenog koda. Medjutim po mom misljenju za ovako obiman projekat i za nase uslove (finansijske) ovde bi dobro doso jedan open source projekat
[ Dragi Tata @ 12.02.2002. 17:45 ] @
Citat:
madman:
Medjutim po mom misljenju za ovako obiman projekat i za nase uslove (finansijske) ovde bi dobro doso jedan open source projekat


Sve je to lepo, ali bio bi potreban bar jedan jak stručnjak za kompjutersku lingvistiku, koji bi bio spreman da besplatno radi godinama da bi sastavio koliko-toliko prihvatljiv sistem za prevođenje. Jedino ako bi recimo neko sa filološkog fakulteta pokrenuo takav neki projekat, koji bi možda finansirala vlada.

Bojim se da je kompjuterski prevodilac "prevelika koska" za Open Source. Uostalom, zna li neko za bilo koji Open Source prevodilac (za bilo koje jezike)?
[ Dragi Tata @ 12.02.2002. 17:54 ] @
Nego, evo i on-line verzije hrvatskog prevodioca. Uživajte:

http://www.tranexp.com:2000/InterTran?

Original: Don't ask what your country can do for you.
Prevod (na hrvatski): Ne pitati što tvoj kraj može ubiti te.
Prevod (na srpski): Don't ask što tvoj kraj može učiniti te.

Ludo, a?
[ random @ 12.02.2002. 21:42 ] @
Citat:
Dragi Tata:
Uostalom, zna li neko za bilo koji Open Source prevodilac (za bilo koje jezike)?


Znam na primer ja. Molim rasvetu da obasja GPLTrans.
[ Dragi Tata @ 12.02.2002. 21:50 ] @
Citat:
random:
Citat:
Dragi Tata:
Uostalom, zna li neko za bilo koji Open Source prevodilac (za bilo koje jezike)?


Znam na primer ja. Molim rasvetu da obasja GPLTrans.


Primer sa GPLTrans-a:
Don't ask your country what it can do for you
Don't ask il tuo country che esso brocca do per you

Očigledno nije u pitanju pravi translator, već tzv "word translator" koji samo zamenjuje neke reči, bez primene gramatičkih pravila.
[ leka @ 12.02.2002. 23:10 ] @
Logicno da su svi ti prevodioci glupi - narode takav softver ne može da se piše u C-u! To je naravno moje mišljenje... Naravno kao i uvek C programeri su uvek ispred svih i svaka čast, ali je problem takav da zahteva neki drugi jezik - recimo Prolog ...
[ random @ 13.02.2002. 01:08 ] @
Citat:
Dragi Tata:
Očigledno nije u pitanju pravi translator...


Well, tražio si bilo kakav.
[ MoHicAn @ 13.02.2002. 02:14 ] @
Citat:
leka:
Logicno da su svi ti prevodioci glupi - narode takav softver ne može da se piše u C-u! To je naravno moje mišljenje... Naravno kao i uvek C programeri su uvek ispred svih i svaka čast, ali je problem takav da zahteva neki drugi jezik - recimo Prolog ...



Ja mislim da tu ne bi moglo nista da se uradi sa nekom vestackom inteligencijom! Tu je jedino resenje ogromna baza podataka i neki logaritam proebacivanja vremena (mada ni to ne bi bilo savrseno zbog razlicitih recenicnih konstrukcija u engleskom u odnosu na srpski) U svakom slucaju mislim da vestacka inteligencija nije jos dostigla taj nivo da bi tako nesto moglo da se odradi u prolog-u!
[ Dragi Tata @ 13.02.2002. 16:24 ] @
Ljudi, samo nekoliko činjenica o kompjuterskom prevodu teksta.

1. Kompjuterska lingvistika je nauka za sebe. Postoje katedre na fakultetima koje se bave time, postoje knjige, stručni seminari, i tako dalje. U firmi za koju radim (BGS) znam 1 doktora kompjuterske lingvistike i bar 3 magistra. Znači, potpuno je besmislena ideja da grupa programera može da sedne i da se dogovori da napravi program za prevođenje teksta. To bi bilo kao kad bi rešili da sednemo i projektujemo nov tip automobila bez ijednog inženjera mašinstva.

2. Sistemi za prevođenje koji su trenutno aktivni JESU zasnovani na veštačkoj inteligenciji, a pisani su ili u C-u ili u C++u. Naravno da postoje i baze podataka sa rečnicima, neprevodivim frazama i sl. ali sam proces prevođenja se izvodi preko veštačke inteligencije. Najbolji među tim sistemima su čak sposobni i da "uče", tj da se usavršavaju stalnom upotrebom. Posebna vrsta su tzv Computer Aided Translation sistemi, koji su predviđeni da rade sa "živim" prevodiocima i da im olakšaju rad.

3. Sistemi za kompjutersko prevođenje teksta jesu "glupi", ali stalno napreduju kako u kvalitetu, tako i u brzini prevođenja. Drugo, ne mogu se porediti razni amaterski i polu-amaterski pokušaji, kao što je GPLTrans ili tranexp sa vrhunskim sistemima za prevođenje teksta kakve nude BGS, Systran, IBM, i tako dalje.

4. Ne treba očekivati da će ovakvi programi ikada biti u stanju da uspešno prevedu Šekspira, ali već sada su na takvom nivou da mogu da budu jako korisni. Pomoću njih već sada možeš da prevedeš tekst sa potpuno nepoznatog jezika dovoljno dobro da razumeš o čemu se radi.

Najzad, nekoliko linkova na dobre sisteme za prevođenje teksta:

BGS-ov itranslator (malo samoreklamiranja):
http://itranslator.mendez.com

Systran:
http://www.systransoft.com/

IBM-ov Web Sphere translation:
http://www-4.ibm.com/software/speech/translation/demo/

World Lingo:
http://www.worldlingo.com/prod...ces/worldlingo_translator.html-world.demon.co.uk
Satellite
[ madman @ 13.02.2002. 16:33 ] @
Slazem se sa ovim o kompijuterskoj lingvistici!
ali jednom se domaci IT profesionalci moraju zainteresovati i za nas jezik, a jedini nacin je ucestalija prica o tome, pa cak i amaterski pokusaji.

Npr.
Sajt na koji dolaze ljudi koji znaju srpski i engleski i recimo sami prevode fraze. Pa ubacuju vec preveden tekst. Jeste glupo na prvi pogled, ali to je jedini nacin. Znaci 10-20 amaterskih pokusaja, pa se rode iskustva i onaj 21 pokusaj (10-20 godina) bude uspesan. treba jednom krenutni, a po mom misljenju najbolje je diskutovati na koji nacin treba prve pokusaje izvesti koji je nacin organizacije.
tipa AI ili prevodjenje fraza itd...
[ madman @ 13.02.2002. 16:59 ] @
Moram jos dodati, recimo znamo da smo siromasna drzava.
Ali imamo fakultete koji se trude da nesto urade.
Imamo Matematicki, Filoloski.
E sada recimo skupina programera amatera se skupe. Neko poznaje lingistu na filoloskom neko programera na matematickom. Poprica se sa njima vide se predlozi, i cas posla to moze da se veze u univerzitetski projekat i saradnju izmedju faksova. A verujem da ljudi i sa ova dva fakulteta iz svake oblasti znaju veoma dosta. Samo je jedini problem kako doci do njih. Znaci postoji problem organizacije. A to bi bilo lepo resiti , raspraviti ovom diskusijom
[ Dragi Tata @ 13.02.2002. 17:49 ] @
Koliko mogu da vidim na ovom linku

http://www.matf.bg.ac.yu/katedre/racunarstvo/nauka.htm ,

postojali su već neki takvi projekti. Da li neko može da proveri šta je bilo sa time i eventualno da popriča sa ljudima koji su učestvovali? Da sam u Srbiji rado bih se prihvatio, ali ovako moram da apelujem na nekog ko je u Beogradu.
[ Dragi Tata @ 13.02.2002. 21:15 ] @
A evo i jedne knjige o tome u ps formatu. Idite na google i kucajte

MTbook2up.ps

Link ne radi iz ES-a. :(
[ Sexual Predator @ 14.02.2002. 06:24 ] @

Postoji program i zove se "Yu Recnik"

Uradio ga je Predrag Vujic

www.yustart.co.yu

Ja ga uspesno koristim nesto manje od dve godine.
[ Dragi Tata @ 14.02.2002. 19:59 ] @
Koliko sam mogao da zaključim sa sajta

http://solair.eunet.yu/~vlad.o.b/rc.htm

I to je "Word translator" koji samo zamenjuje neke reči, bez primene gramatike. Citiram:

"Vrlo interesatnan deo programa je modul za prevod celog teksta odjendaput. Naravno, ne možete očekivati da se tekst besprekorno prevede, ali rezultat koji je u vidu liste reči iz teksta sa njihovim prevodima, ipak omogućava manje-više uspešno shvatanje željenog teksta. Sobzirom da se rečenice prevode reč po reč, a neke od njih imaju više potpuno različitih značenja, nekad vam ova opcija neće pomoći, ali je ipak iluzorno očekivati da bilo koji program uspešno prevede neki tekst sa jednog jezika na drugi."

Da me ne shvatite pogrešno - ne potcenjujem ljude koji prave i takve stvari, ali to ipak nije sistem za prevođenje teksta.
[ cross_boy @ 15.02.2002. 18:11 ] @
Takav prevodilac bi bio pravi napredak ....Otkrila bi se vestacka inteligencija , zar ne ???
[ Predrag Damnjanovic @ 15.02.2002. 18:44 ] @
Citat:
cross_boy:
Takav prevodilac bi bio pravi napredak ....Otkrila bi se vestacka inteligencija , zar ne ???

:) ;) :) ;)
Nisam znao da se ona 'otkriva' :)
[ cross_boy @ 17.02.2002. 13:21 ] @
Hvala sto si me napomenuo .... Vjerujem da nije tesko da se uvidi sala ....
[ pegazus @ 19.02.2002. 10:08 ] @
Pozdrav svima,

Masina koja bi mogla da prevodi prirodne jezike bi bila
bez ikakve sumlje INTELIGENTNA. Resavanjem tog problema
resili bi se i mnogi drugi u ovoj oblasti i obrnuto.
(meni najvise lici na opsti dokazivac teorema)

Standardni racunarski kurs koji pokriva delimicno ovu oblast je
Prevodioci i Interpretatori,
neohodna znanja za bilo kakav razgovor su:
automati(konacni ...), regularni izrazi(perl)(lex), formalni jezici i gramatike
i mozda jos po nesto.

Sto se tice matematickog fakulteta, tamo postoje ljude koji se bave
slicnim istrazivanjima, mislim da ne bi imali nista protiv da im se pomogne,
ali znanje iz navedenih oblasti je neophodno.

Literatura:(moja)
Parsing Tehnics(sintaksna analiza), neki engleski univerzitet
Compilers and Compiler Generators, Holandski univerzitet

Obe knjige se mogu downloadovati.

Ja sam licno za sad vise zainteresovan za prevodjenje formalnih jezika,
dakle klasicni programski jezici, ali se mozda kasnije uputim i u vode
inteligentnih sistema u svakom slucaju za pronalaske u racunarstvu
najzasluzniji su mladi ljude(postdiplomci), tako da je moje misljenje da
su magistri tu u malom zaostatku.

Jos jednom, pozdrav svima
[ Dragi Tata @ 19.02.2002. 16:48 ] @
Citat:
pegazus:

Standardni racunarski kurs koji pokriva delimicno ovu oblast je
Prevodioci i Interpretatori,
neohodna znanja za bilo kakav razgovor su:
automati(konacni ...), regularni izrazi(perl)(lex), formalni jezici i gramatike
i mozda jos po nesto.

Literatura:(moja)
Parsing Tehnics(sintaksna analiza), neki engleski univerzitet
Compilers and Compiler Generators, Holandski univerzitet


Ključna znanja za ovu oblast su vezana za veštačku inteligenciju (ekspertski sistemi, fuzzy logika, neuralne mreže, ...) a sintaksna analiza i slične stvari su bitna ali ipak sporedna stvar.


Citat:
pegazus:

u svakom slucaju za pronalaske u racunarstvu
najzasluzniji su mladi ljude(postdiplomci), tako da je moje misljenje da
su magistri tu u malom zaostatku.


Postdiplomci (pa i magistri) su obično "radna snaga", a projektima upravljaju doktori nauka. Ovo naravno važi za univerzitete i institute, a u kompanijama se titule slabo gledaju.
[ pegazus @ 19.02.2002. 19:45 ] @
Kao prvo Veliki Tata je potpuno u pravu, ali
Da si ne bi gadjali apstraktnim pojmovima,
evo kako izgleda prevodjenje jednog jezika u drugi
u najnajkracim crtama

Prvi Deo:Analiza

Jezik (pogotovo prirodni) je beskonacan.
Da bi na bilo koji nacin opisali jezik, mi
moramo imati Konacan skup pravila koje opisuju taj jezik ->
Gramatika.
Leksickom analizom prepoznajemo reci jezika.
Sintaksnom analizom ispitujemo da li je neka recenica iz datog jezika,
odnosno da li se moze izvesti datom gramatikom(Paklena oblast)
Na kraju Sintaksne analize dobijamo Sintaksno drvo
Polmove koje nalazimo u recenici moramo prepoznati u bazi poznatih pojmova.
Semantiskom analizumo povezujemo odnose medju njima i previmo
Semanticko drvo
koje strukturom odgovara smislu recenice.(problem kod prirodnih jezika) ***


Drugi deo:Sinteza

Pronaci ekvivalente gramaticke konstrukcije u ciljnom jeziku.
Konstruise se strukturalno skoro istovetno Semanticko drvo(zavisi od srodnosti jezika)
sa sadrzajem iz ciljnog jezika.
Vrsi se jednostavna linearizacija drveta i dobija se prevedena recenica.


Sintaksna,Semanticka analiza i Sinteza su najtezi delovi prevodjenja.
Kod Sintaksne analize sintagme a kod Semanticke i Sinteze je vec problem vestacke inteligencije

Inace nikako se nesme potceniti snaga regularnih izraza i automata
Prvi mogu da uhvate sve morfoloske promene(reci), a drugi veliki broj
Sintaksnih analiza.
[ Dragi Tata @ 19.02.2002. 19:57 ] @
Pegazuse, izgleda mi da si prilično upućen u temu. Ako te zanima, pogledaj knjigu u ps formatu o kompjuterskom prevođenju teksta. Link je gore u jednom od mojih postova u ovoj temi.

Iskren da budem, počeo sam da je čitam, ali sam batalio posle uvodnih poglavlja...
[ amidar @ 04.03.2002. 01:36 ] @
"U svojoj polemichnoj i mestimichno chak nihilistichkoj knjizi Taube je ipak izgovorio na nachin reprezentativan za izvestan krug istrazhivacha objekcije koje su i dalje dostojne pazhnje. Pokrenuo je, naprosto, josh jednom klasichnu dilemu >> mozhe li mashina da misli <<, razmatrajucci je u razbijanju na dva chlana - delatnosti optereccenih semantichki, i intuitivnih delatnosti. Chini se da formalno napredovanje stvarno ima ogranichenja kojima ga optereccuju konsekvencije Gedlovog dokaza o nepotpunosti dedukcijskih sistema i da je chisto algoritmichkim metodima nemogucce istinski uspeshno prevoditi s jednog prirodnog jezika na drugi, poshto ne postoji odnos uzajamnog jednoznachnog odslikavanja izmedju jednog i drugog jezika." ...

Stanislav Lem
Summa Technologiae


[Ovu poruku je menjao amidar dana 04.03.2002 u 08:35 AM GMT]
[ mira @ 04.03.2002. 02:57 ] @
Ljudi se trude....
http://www.matf.bg.ac.yu/nastavno/dvitas/
[ pegazus @ 06.03.2002. 15:10 ] @
Slazem se da masina pre svega nece moci da otkrije nista <b>novo</b>,
mada postoje ozbiljne teorije koje tvrde da je svako covekovo otkrice doslo
"<b>slucajno</b>", ja se pre svega uzdam u cistu sabloniziranost procesa
ucenja kod veceg procenta ljudi.
[ simpson @ 10.05.2002. 00:13 ] @
Ne zamerite mi, ali ja verujem da je nesto tako nemoguce napraviti.

Vreme ce pokazati da li sam u pravu!
[ drdrksa @ 10.05.2002. 09:17 ] @
Citat:
simpson:
Ne zamerite mi, ali ja verujem da je nesto tako nemoguce napraviti.

Vreme ce pokazati da li sam u pravu!


Zameramo ti ........

Vidis da se ljudi trude i daju sve od sebe ...........
[ Ilija Studen @ 19.05.2002. 02:13 ] @
Postoje programi za proveru gramatike i za nas jezik (mislim da se zove PAC - citaj kao cirilicu). Zasto ne napraviti program koji ce prevoditi rec po rec, a zatim dobijeni tekst propustati kroz razne algoritme za proveru jezika, fraza... To uopste nije tesko isprogramirati ukoliko imamo dobru bazu i dobru ideju.

Primera radi, za prevodjenje fraza koristimo ciklus. Posto retko koja engleska fraza sadrzi preko 5 reci program grupise reci u grupe, a zatim proverava da li ima adekvatno resenje (za dve, tri, cetiri ili pet reci u nizu). Ukoliko ne nadje prevede samo prvu rec i prelazi na sledecu.

(Primer ima anomalija, ali bi se one resile u hodu, kad se sa problemom sretnemo oci u oci).

Ljudi, najlakse je reci:"Ne moze to..."
[ Goran Rakić @ 15.06.2002. 22:54 ] @
Što se mene tiče "reč po reč" prevodioci savršeno rade posao (pitajte moju profesorku francuskog kako imam 5 iz francuskog? - živeo babelfish.altavista.com i Systran)...

Inače ma koliko želeo da pomognem, ovakve stvari su nemoguće bez visokoobrazovanih i u tematiku upućenih ljudi kakvih, koliko sam ja primetio ovde ima jako malo...
[ vb_net_manuel @ 29.07.2002. 18:52 ] @
mislim da je moguce napraviti taj prevodilac...
postoji toliko programskih trikova... koji bi mogli odraditi
mnogo stvari koje nepostoje ni u samoj lingvistici...

najbolje je kretinuti od raznih ogranicenja....

- prevodilac treba ograniciti za kompijutersku terminologiju...
(automatski ste resili najveci problem ponavljanja reci sa drugim znacenjima).
- slicnost eng i srpskog po pitanju tehnoloski reci olaksava milion stvari...
jer mi jos nemamo neke nase reci za neke stvari...
- u kom. terminologiji imate i do 30% skracenica koji se cesto ponavljaju...
- tekst mora biti unet gramaticki ispravno do najmanjeg zareza...
npr. You'd umesto You had... ne dolazi u obzir... jer to moze biti You would ...
- potrebno je dosta pomocnih programa da lakse pune baze... npr.
unesete jedan glagol a on ga u bazi unese u svim vremenima... itd...

moja neka procena za takvu vrstu software-a je

10 programera
2 lingvisticara

svi dostupni recnici, gramatika, kompjuterska literatura...itd..

za funkcionalnost do 95 odsto... 1 godina... a ostalo bi se usavrsavalo u narednim verzijama...

odraditiu to besplatno.... zaboravi odmah....

tome se treba posvetiti maksimalno sa svim maksimalnim uslovima rada...
(skeniranje stranica knjiga i njihovo pretvaranje u tekst i brisanje suvisnog teksta mora biti automatizovano...
- to bi odradili programeri...

posao mora biti u zemlji engleskog govornog podrucja....
sa saradnjom svih institucija koje bi mogle pomoci...

takav projekat bi trebao pokrenuti neko ko ima vise novca i od nase drzave...
a programerima bi se morali obezbediti svi neophodni microsoft kursevi...
i najbolje specijalizacije...

takav prevodilac bi bio zaista revolucija...
zamislite samo koliko bi se knjiga moglo prevesti dnevno...

a taj koji bi to finansirao... vratilo bi mu se sve ulozeno i 1000%

ps: eto, to je moje misljenje...













[ Goran Rakić @ 29.07.2002. 19:06 ] @
to je ipak reč po reč princip a to već postoji... (ajde prevedi Šekspira sa takvim prevodiocima)...
[ Ilija Studen @ 08.09.2002. 19:50 ] @
Svi govore da je trško (nemoguće) napraviti program koji će prevod praviti na osnovu konteksta, a ne na osnovu bukvalnog značenja reči. Ali, kontekstualno prevodjenje je vrhunac koji se zasniva na dobrim programskim temeljima "bukvalističkog" pristupa i odličnoj bazi pojmova.

Danas sam malo razmišljao o tome kako bi trebalo napraviti prevodilac i došao do par problema:

o Česta pojava grčkih slova, mernih jedinica, skraćenica, vlastitih imena, datuma, sktaćenih matematičkih izraza koja se moraju tretirati kao neprevodivi ili delimično prevodivi pojmovi;
o Potrebno je napraviti sistem koji će logički raslojiti rečenicu na celine (ako je u pitanju duga prostoproširena rečenica sa mnogo apozicija);
o Potreban je jak sistem gramatičkog prepoznavanja i raslojavanja (raslojiti prvo na predikstsku, subjekatsku i objekatsku strukturu, a zatim svaku proučiti i prevesti);
o Potrebna je ogromna baza kontekstualno jedinstvenih i jediničnih značenja.

Palo mi je još mnogo stvari na pamet, ali ne mogu da ih se setim. Ako je neko zapazio još nešto neka napiše.

Takodje, može li me iko uputiti na dobar online rečnik.
[ Dragi Tata @ 09.09.2002. 18:52 ] @
Citat:
Go! X:
Što se mene tiče "reč po reč" prevodioci savršeno rade posao (pitajte moju profesorku francuskog kako imam 5 iz francuskog? - živeo babelfish.altavista.com i Systran)...


Babelfish i Systran nisu "reč po reč" prevodioci.
[ ||NeX|| @ 25.05.2006. 17:53 ] @
A šta biste preporučili za eng.-njem. i srb/hrv - njem.?
[ Buum @ 26.05.2006. 02:06 ] @
Ne zaluđujte se ljudi, CIA je to već napravila.

Mohican je dao sugestiju koja je najpribližnija konceptu na osnovu koga je kreirano takvo rešenje. Ako želite da saznate nešto više o tome, ključna fraza za pretragu po Googlu je: statistical machine translation.

Glavna fora je da se uzme strahovito veliki korpus reči i da se odradi statistička analiza, tako da se za svaku reč dobije vrlo precizan kojeficijent pojavljivanja. To se kasnije kombinuje sa klasičnim rečnicima što za rezultat ima prevod koji je tri klase iznad svih postojećih (komercijalno dostupnih) rešenja.

Po mojim saznanjima CIA je kao osnovni korpus koristila Bibliju pošto je ona prevedena na gotovo sve jezike. Evo jednog teksta na tu temu:

Citat:
Statistical machine translation - in which computers essentially learn new languages on their own instead of being "taught" the languages by bilingual human programmers - has taken off. The new technology allows scientists to develop machine translation systems for a wide number of obscure languages at a pace that experts once thought impossible.

Dr. Knight and others said the progress and accuracy of statistical machine translation had recently surpassed that of the traditional machine translation programs used by Web sites like Yahoo and BabelFish. In the past, such programs were able to compile extensive databanks of foreign languages that allowed them to outperform statistics-based systems.

Traditional machine translation relies on painstaking efforts by bilingual programmers to enter the vast wealth of information on vocabulary and syntax that the computer needs to translate one language into another. But in the early 1990's, a team of researchers at I.B.M. devised another way to do things: feeding a computer an English text and its translation in a different language. The computer then uses statistical analysis to "learn" the second language.

[...]

Today researchers are racing to improve the quality and accuracy of the translations. The final translations generally give an average reader a solid understanding of the original meaning but are far from grammatically correct. While not perfect, statistics-based technology is also allowing scientists to crack scores of languages in a fraction of the time, and at a fraction of the cost, that traditional methods involved.

A team of computer scientists at Johns Hopkins led by David Yarowsky is developing machine translations of such languages as Uzbek, Bengali, Nepali - and one from "Star Trek."

"If we can learn how to translate even Klingon into English, then most human languages are easy by comparison," he said. "All our techniques require is having texts in two languages. For example, the Klingon Language Institute translated 'Hamlet' and the Bible into Klingon, and our programs can automatically learn a basic Klingon-English MT system from that.''

Dr. Yarowsky said he hoped to have working translation systems for as many as 100 languages within five years.

Izvor: http://amygdalagf.blogspot.com/2003_07_27_amygdalagf_archive.html