[ Vlada A @ 08.01.2012. 22:03 ] @
Zelim da napravim algoritam koji bi izdvajao najbitnije informacije iz nekog teksta na osnovu kljucnih reci ili recenice.

Mislio sam da uradim neki vrstu machine learninga na sledeci nacin a Vi kazite da li je dobro resenje:

1. Najpre za neku kljucnu rec preuzmem rezultate za tu rec sa gugla, binga i jos nekih bitnijih pretrazivaca.
2. Preuzmem sadrzaj sa stranica koje su pretrazivaci izbacili.
3. Objedinim sve stranice u jedan tekst i iz njega izvucem najkoriscenije reci.
4. Parsiram svaku stranu zasebno na recenice i paragrafe i krene uporedjivanje sa najkoriscenijim recima koje sam dobio u prethodnom koraku.
5. Recenica - paragraf koji ima najvise slicnosti sa kljucnim recima je verovatno i najrelevantniji materijal sa te strane za zadatu kljucnu rec.

NPR. dobijam: web programiranje <=> php,java,mysql ...
sportski sutomobili <=> ferari,porse,audi r3 ... itd.


tj. zelim da napravim neki vezu izmedju odredjene teme i kljucnih reci, da dobijem reci koje bi opisivale odredjenu frazu, recenicu, rec... kako bih dalje mogao odredim sta je najbitnije iz odredjenog teksta.
[ Vlada A @ 09.01.2012. 01:15 ] @
Mozda odgovor lezi ovde: http://www.enggjournals.com/ijcse/doc/IJCSE11-03-03-117.pdf :)