[ ncosic @ 31.01.2012. 12:21 ] @
Potreban je Perl developer za redovan posao izrade ekstraktora podataka sa weba. Postoji potreba za desetak ekstraktora mesečno, plaćam $20-$50 po sajtu u zavisnosti od složenosti.

Ja bih uputio potencijalnog saradnika detaljno u metodologiju kojom se ekstraktor za jedan sajt završava u roku od 1-5h. Po mom iskustvu, posle 3-5 ekstraktora ovo može svako ko je iole upoznat sa regularnim izrazima.

Postoji već utvrđena metodologija izrade koja treba da se isprati - npr koristimo LWP, ne koristimo WWW::Mechanize jer imam bolje rešenje. Poznavanje regularnih izraza je neophodno. Na primer, developer bi trebalo da zna šta rade sledeći izrazi:
s/<[^<>]+>//sg
s/^\s*|\s*$//sg
/<a\s[^>]*href="([^"]+)"/s


[Ovu poruku je menjao ncosic dana 31.01.2012. u 13:31 GMT+1]

[Ovu poruku je menjao ncosic dana 31.01.2012. u 13:32 GMT+1]