[ Dusan Gacic @ 26.05.2005. 19:00 ] @
Imam oko 10000 linkova + mozda jos 5000, u ovom ili slicnom obliku:
http://www.blsfsdla.com/bfla/bl.htm Link1
2 16 http://www.blasdf.com/bfla/bll.htm Link2
neki text http://www.blda.com/blsa/blddl.htm Link3

e sad to treba da dovedem na ovakav oblik:

<a href="http://www.blsfsdla.com/bfla/bl.htm">Link1</a>
...........
.............

Kako da ovo najbrze/najbezbolnije uradim?
[ dejanc @ 27.05.2005. 20:19 ] @
hmmm, pokusaj ovako
uzmi i u nekom editoru u kome radis idi na onu opciju da nadjes i zamenis, u polju za pretradu unesi npr. http:// i zameni sa <a href="http:// i isto tako zameni .htm sa .htm"> a da uneses </a> to vec malo teze...
[ Dusan Gacic @ 27.05.2005. 21:19 ] @
Hvala na odgovoru!
Sve sam to probao, ali problem je sto imam description posle url sajta, a pre nekih sajtova se nalazi text.
Tako da se opet svodi na copy/paste.

Da li ima neki text "extract tool"?
[ old @ 28.05.2005. 02:35 ] @
I 15 000 linkova je lakše poluautomatski obraditi kako je pokazano, u odnosu na nabavku i aktivaciju programa za rad sa "regex".
Jer namučio bi se da naučiš, plus namučio bi se da pronađeš (izmisliš) formule za tvoj slučaj.
(Košta vremena bez obzira na inteligenciju).
[ WEXY @ 28.05.2005. 02:56 ] @
C, PHP, Pascal... ?

Prođeš kroz fajl, čitaš liniju po liniju, izvučeš link (od http://.. do ...htm), sačuvaš u neku promenljivu kao URL, detektuješ tekst posle toga do kraja reda smestiš ga u neku drugu promenljivu, formatiraš kako ti treba i upišeš u neki fajl i onda loop-uj :)

Ja bi tako, najbrže i najlakše (ako nađem vremena danas možda i napišem to).

@mod: Mislim da ova tema ne pripada ovde.
[ Dusan Gacic @ 28.05.2005. 09:36 ] @
Slazem se sa tobom, ali ne znam programiranje,
tako da moram da koristim nesto drugo.
WEXY stvarno bi tii bio zahvalan ako bi to mogao da odradis!
Nisam napisao da su nekada linkovi zavrsavaju i sa html,php....
Mozda bi bolje bilo napisati prog, koji ce da cita od "http://" pa sve dok ne procita razmak (beli znak).
takodje nekada prvo ide description, pa tek onda http://

Hvala u svakom slucaju na odgovorima!
[ WEXY @ 29.05.2005. 01:19 ] @
Evo nešto na brzinu, nisam mogao ranije. Nisam ga nešto puno testirao ali trebao bi da se lepo snalazi sa onim primerom što si dao u prvom postu znači ovako:

ulaz:
Code:

jfsjfh jfhaksjfh kjsdhfkjash http://www.link1.com/lorem.htm Lorem ipsum dolor sit amet
dsafsdf fd fd f

fdsfs
fs sffsdfs fsd fs
http://www.link2.com/lorem2.php Lorem ipsum dolor PHP
      http://www.link3.com/lorem3.html                  Lorem ipsum


U principu sve pre http će da batali :), link da stavi u href, a sve posle bez razmaka na početku će staviti kao text linka.

Nadam se da su ti svi textovi za link iza linka, ako su ispred ignorisaće ih, može i ovo da se doradi da radi i ako je text ispred al ne mogu to sad, ako ti treba videćemo, to malo komplikuje stvari ako ti je svaka linija drugačija :)

EXE je u attachmentu, ako ti treba postaviću i source i naravno exe je ono što si tražio a ne nešto maliciozno :)

Sintaxa ti je (u konzoli kucaš): linkovi.exe MAX_LINE_LENGHT INPUT_FILE OUTPUT_FILE gde su:

MAX_LINE_LENGHT - maximalna dužina linije u ulaznom fajlu
INPUT_FILE - fajl iz koga čita
OUTPUT_FILE - fajl u koji ispisuje html

Ako bude problema javi :)
[ Dusan Gacic @ 29.05.2005. 09:22 ] @
HVALA!
Idem da isprobam
[ Dusan Gacic @ 29.05.2005. 18:34 ] @
Problem:
"Error reading line from input file proba.txt on line 10, aborting"
To se desava kada stavim da je MAX_LINE_LENGHT 10000
a kada stavim da je 1000 onda se pojavi poruka:
"Memory couldnt be writen" ili tako nesto

Uploadovao sam fajl proba.txt
[ WEXY @ 29.05.2005. 21:30 ] @
Hm... prvi put kad sam probao ovaj tvoj proba.txt nije prijavio nikakvu grešku ali nije baš korektno formirao izlaz, to sam ispravio sad bi trebalo da je sve ok, tj. ovaj proba.txt odradi lepo. Nekad se i meni desi da pukne ako staviš preveliku dužinu linije mada to ne bi trebalo da pravi problem.. ako stavis 10000 to je 10000 * veličina char-a to je ~10kb memorije, meni je evo sada radi sa 20000 :) A nekad neće ni sa 1000 .. to stvarno ne znam do čega je. Koliko vidim iz ovog primera ni jedna linija nije vec od 200 karaktera ti stavi 500 za svaki slučaj i biće ok valjda.

Okačio sam novi prog evo.
[ Dusan Gacic @ 29.05.2005. 22:09 ] @
A sada radi sve, doduse samo sa 49 i 449 za duzinu linije, za sve ostale kombinacije sto sam probao prijavljuje gresku.

Stvarno ne znam kako da se zahvalim!
[ WEXY @ 29.05.2005. 22:46 ] @
Dovoljno je što si rekao hvala :) Ja nisam imao ništa drugo da radim, a eto tebi sam pomogao, nije za džabe potrošeno vreme u svakom slučaju :)

Pozdrav.
[ Dusan Gacic @ 30.05.2005. 15:16 ] @
Jos jednom puno hvala za program!
Da li nekako mogu da ga koristim ako prvo imam description pa tek onda http://asdsa.com/asd/asd.htm pa opet neki text.
Kao u ovom slucaju (fajl uz poruku)
???
[ WEXY @ 30.05.2005. 15:49 ] @
Ne... ima pukne skroz ako mu daš ovo :) Ja sam onaj program pisao po onoj šemi koju si dao u prvom postu to jednostavno ne odgovara ovome.

Mogu ti napravim drugu verziju koja će da se snalazi sa ovim (ali tek sutra) ako ti treba, ali mi moraš reći šta ti je od ovog "koristan" materijal, šta ti ne treba i kako da formatiram izlaz.

Piši mi na mejl daleko smo odmakli od Web Dizajn-a, pozdrav.
[ djoka_l @ 31.05.2005. 14:36 ] @
Zaista, lakše je naučiti neki jezik kao awk nego sakupiti 15000 linkova na pornografske sajtove. Napisao sam awk program od dva reda koji odradi to što tebi treba (sa podacima iz drugog fajla), ali iz principa neću da ga stavim na forum.

Inače, učenje awk-a (ili gawk-a, svejedno) zahteva jedno prepodne.
[ Pharos @ 31.05.2005. 16:52 ] @
:)
Pa napisaću ti ja program za ovu pornjavu.
Znači ako imaš
Code:
Alicia tits fucks and sucks|photo|http://www.galleryhost.com/100...fuckers/custom/ttfkpgalicia01/|Breast Lovers

trebaš da dobiješ:
Code:
<a href="http://www.galleryhost.com/100...fuckers/custom/ttfkpgalicia01/">Alicia tits fucks and sucks</a>

Da li sam te dobro razumeo?
pOz
[ WEXY @ 01.06.2005. 01:39 ] @
Poslao sam ti mejl sa jednim programom za sve tri verzije koje si trazio.

Pozdrav.
[ Dusan Gacic @ 02.06.2005. 13:20 ] @
WEXY jos jednom hvala!
Pomogao si mi i to cenim, ako ti nesto treba slobodno me kontaktiraj.

@djoka_l:
OK je to, znam sta hocces da kazes, ali jednostavno nemam ni malo slobodnog vremena.

@Pharos:
U svakom slucaju hvala
[ Pharos @ 02.06.2005. 21:27 ] @
E šteta... Baš sam hteo u mom CV-u da dodam, radio sam program za filtriranje pornografskog materijala. Sad ne znam koliko sam se dobro izrazio, ali razumeo bi me poslodavac :)
Ništa sad samo još da javiš sajt kad ga napraviš i ako ikad odlučiš da napraviš komercijalnu verziju, meni besplatna članarina za ceo život.
pOz