|
[ vatri @ 22.09.2009. 11:29 ] @
| postavicu ovde moje pitanje koje je vezano za parsiranje HTML-a. Ako mod. misle da nije u redu neka obrisu i postavicu novu temu....
treba mi regularni izraz koji ce mi vratiti sve vrijednosti izmedju <td (neki atribut ili bez njega)> i </td> tagova, cak iako je NULL (znaci ne space nego null).
ovako sad izgleda i super radi osim sto kada naidje na ovakav kod <td></td> ili <td atribut="vrijednost"></td>, ne registruje nista:
Code:
$pat = '/<td[^>]*>(.[^<]*)<\/td>/si';
preg_match_all($pat,$tekst,$ma);
echo'<textarea cols="100" rows="50">';var_dump($ma);echo '</textarea>';die;
( ovaj echo je samo za "debug" )
Koliko znam ovaj u ovom djelu (.[^<]*) govorimo "sve osim znaka < bilo koje duzine".
Znaci tu je * koja bi trebalo da oznacava 0 ili vise jel tako? Nije mi jasno zasto ne radi |
[ Nemanja Avramović @ 22.09.2009. 12:11 ] @
Izdvojio sam ti poruku u posebnu temu.
Imaš gotovo rešenje u vidu klase - ovde: http://www.phpclasses.org/browse/package/3022.html
No svakako, ako ti nije hitno, uvek je bolje usavršiti svoj kôd 
[ vatri @ 22.09.2009. 12:18 ] @
OK nek si izvdvojio meni ne smeta :)
znam za tu klasu.
Ali nazalost ne pomaze jer ja nemam kompletnu tabelu u varijabli $tekst. Ona otprilike ovako izgleda (ne pitajte zasto) :))
Code:
</th></tr></table><table class="tabVL"><tr> <th>Naziv tvari</th> <th>%</th> <th>CAS br.<br>EC br.<br>Index br.</th> <th>Oznake upozorenja</th> <th>Znakovi opasnosti</th> <th>Broj registracije</th></tr><tr> <td>Petroleum gases, liquefied</td> <td align="center">5-15</td> <td>68476-85-7<br/>270-704-2<br/>649-202-00-6</td> <td>R12</td> <td>F+</td> <td align="center">-</td></tr><tr> <td>Destilati (nafta), laki, hidrotretirani</td> <td align="center">1-5</td> <td>64742-47-8<br/>265-149-8<br/>649-422-00-2</td> <td>R65-66</td> <td>Xn</td> <td align="center">-</td></tr><tr> <td>Bijeli špirit</td> <td align="center">3-7</td> <td>8052-41-3<br/>232-489-3<br/>649-345-00-4</td> <td>R65</td> <td>Xn</td> <td align="center">-</td></tr><tr> <td>Solvent naphtha (petroleum), light aliph.</td> <td align="center">15-30</td> <td>64742-89-8<br/>265-192-2<br/>649-267-00-0</td> <td>R65-66</td> <td>Xn</td> <td align="center">-</td></tr></table><table class="vsebTockeVL3"><tr> <td class="col65">�</td></tr></table> </td></tr></table><br/><table class="tockaVL"><tr> <th class="tockaVL"><h2>
[ Nikola Poša @ 22.09.2009. 13:27 ] @
Čini mi se da ti je suvišna ta tačka ispred [^<]*, jer si mu ti već rekao da hoćeš sve osim znaka "<".
[ Man-Wolf @ 22.09.2009. 18:36 ] @
Cini mi se da ti je Nikola rekao dobro resenje. Tacka menja jedan karakter, a u slucaju:
Code:
<td></td>
Tu ne postoji ni jedan karakter i samim tim, regex pada .... Probaj da izbacis tacku i trebalo bi da sljaka ;)
[ vatri @ 23.09.2009. 07:07 ] @
U pravu ste, izbrisao tacku i super radi.
Samo jos jedna stvar:
Ovakav patern ne valja jer ako naleti na znak manje ( < ) unutar td-a bice problema :) Znaci tamo u sredini je potrebno dodati: "sve osim </td>"?
ja sam pokusao ovako: $pat = '/<td[^>]*>([^(<\/td>)]*)<\/td>/si';
medjutim cini mi se da ako naidje na t,d, <, >, (, ) ili / preskace tu celiju. Pretpostavljam da je problem u ovim zagradama [ ]. Kako da to rjesim?
[ Nikola Poša @ 23.09.2009. 09:25 ] @
Nema potrebe da u pattern ubacuješ </td>, samo stavi [^<>], odnosno sve osim znakova "<" i ">".
[ vatri @ 23.09.2009. 09:42 ] @
jesi li siguran? po nekoj logici ako naidje na < ili > unutar celije, nece ju "match-ovat".
Primjer, imam kolona temperatura i vrednost celije recimo <25 ili >25 ili tako nesto?
[ Nikola Poša @ 23.09.2009. 09:50 ] @
Da, sad sam primetio da imaš redove sa <br />...  Onda bi mogao ovakav neki pattern: '/<td[^>]*>([^<>]*|.*<br\s?\/>.*)<\/td>/is'. Ili možda ovakav: '/<td[^>]*>(^<\/td>)<\/td>/is'.
Primeti da u ovom drugom nema onih uglastih zagrada, jer njima definišeš skup znakova, a tebi sad treba konkretan string.
[ vatri @ 23.09.2009. 10:55 ] @
ovaj drugi mi ne radi (var_dump radim kao sto se vidi iz prvog posta)? Zasto?
A prvi radi samo me brine zato sto imam u drugoj koloni procenat i postoji mogucnost da mi se javi znak manje ili vece (< ili >).
Tu gore sam imao 5-15 vrijendost te celije (znaci od 5 do 15 posto) ali moze se desiti da se deklarira vise od recimo 25% tada pisemo >25.
U tom slucaju preskocice celiju zbog: [^<>]
[ Nikola Poša @ 23.09.2009. 11:29 ] @
Da, ovaj prvi nije toliko upotrebljiv, jer rešava problem samo sa tim <br /> tagovima. Trebalo bi srediti ovaj drugi... Provaj onda samo da dodaš zvezdicu (*), odma' na kraju tog subpattern-a, ovako:
/<td[^>]*>(^<\/td>*)<\/td>/is.
Inače, sve ovo pišem iz glave, nisam testirao nijedan od tih pattern-a, tako da nemoj da te čudi, ako recimo opet ne bude radilo.
[ vatri @ 23.09.2009. 11:39 ] @
Ne radi ni ovaj. Njega sam inace prije sat vremena takodje probao ali nije radio. Stvarno ne kontam...
Jel postoji mogucnost da je kod mene problem u PHP podesavanjima ili u tom modulu (perl il' sta vec)? Prije par dana sam probavao neki pattern sa nekog tutorijala koji sam nasao na netu i nije mi radio. Ne sjecam se koji je bio ali bilo je nesto za parsiranje HTML-a.
Ajde molim vas ako neko ima vremena da testira ove paterne da utvrdimo da li u PHPu problem.
Ima kod u mom prvom postu. Paterni se nalaze u varijabli $pat tako da samo to treba mjenjat
[ Nikola Poša @ 23.09.2009. 12:02 ] @
Ma nije problem u PHP-u... Ajde probaj ovako: /<td[^>]*>(.*)<\/td>/Uis. Primeti da sam sad dodao taj U modifier. To bi sad 99% trebalo da radi.
[ Man-Wolf @ 23.09.2009. 12:16 ] @
Ili ovako:
Code:
/<td[^>]*>(.*?)<\/td>/i
[ vatri @ 23.09.2009. 12:57 ] @
e super rade oba probao sam.
Jos nesto: trebao bi jos da dodam da NE "match-uje" ako se izmedju TD-ova nalazi <th>. Probao sam sve i svasta ali ne moze. Kako se uopste definise "sve osim <th>" ili bilo koji drugi SKUP znakova?
[ Man-Wolf @ 23.09.2009. 13:26 ] @
Probaj ovako:
Code:
/<td[^>]*>((?!<th>).)*?<\/td>/i
[ vatri @ 23.09.2009. 14:27 ] @
mislim da je to to, samo zasto mi preg_match_all vraca ovakav niz. Zar ne bi trebao u [1] smjestit vrijednosti bez td-eva? (probao sam dodat PREG_PATTERN_ORDER ali isto je naravno)
Code:
array(2) {
[0]=>
array(7) {
[0]=>
string(317) "<td>Naftni plinovi, ukapljeni (ako ne sadrži >od 0,1 % 1,3-Butadiena); #naftni plin; #[[Složeni sastav ugljikovodika....</td>"
[1]=>
string(28) "<td align="center">1000</td>"
[2]=>
string(28) "<td align="center">1750</td>"
[3]=>
string(28) "<td align="center">1250</td>"
[4]=>
string(28) "<td align="center">2180</td>"
[5]=>
string(40) "<td align="left" style="width:30%"></td>"
[6]=>
string(163) "<td colspan="6"> GVI – Granične vrijednosti izloženosti KGVI – Kratkotrajne granične vrijednosti izloženosti BGV </td>"
}
[1]=>
array(7) {
[0]=>
string(1) "]"
[1]=>
string(1) "0"
[2]=>
string(1) "0"
[3]=>
string(1) "0"
[4]=>
string(1) "0"
[5]=>
string(0) ""
[6]=>
string(1) "i"
}
}
[ Nikola Poša @ 23.09.2009. 15:19 ] @
Evo sad sam baš testirao onaj moj poslednji pattern, i evo najpre kod:
Code: $tekst = '</th></tr></table><table class="tabVL"><tr> <th>Naziv tvari</th> <th>%</th> <th>CAS br.<br>EC br.<br>Index br.</th> <th>Oznake upozorenja</th> <th>Znakovi opasnosti</th> <th>Broj registracije</th></tr><tr> <td>Petroleum gases, liquefied</td> <td align="center">5-15</td> <td>68476-85-7<br/>270-704-2<br/>649-202-00-6</td> <td>R12</td> <td>F+</td> <td align="center">-</td></tr><tr> <td>Destilati (nafta), laki, hidrotretirani</td> <td align="center">1-5</td> <td>64742-47-8<br/>265-149-8<br/>649-422-00-2</td> <td>R65-66</td> <td>Xn</td> <td align="center">-</td></tr><tr> <td>Bijeli špirit</td> <td align="center">3-7</td> <td>8052-41-3<br/>232-489-3<br/>649-345-00-4</td> <td>R65</td> <td>Xn</td> <td align="center">-</td></tr><tr> <td>Solvent naphtha (petroleum), light aliph.</td> <td align="center">15-30</td> <td>64742-89-8<br/>265-192-2<br/>649-267-00-0</td> <td>R65-66</td> <td>Xn</td> <td align="center">-</td></tr></table><table class="vsebTockeVL3"><tr> <td class="col65">?</td></tr></table> </td></tr></table><br/><table class="tockaVL"><tr> <th class="tockaVL">';
$pattern = '/<td[^>]*>(.*)<\/td>/Uis';
preg_match_all($pattern, $tekst, $matches);
echo '<pre>'; print_r($matches); echo '</pre>';
A onda i ono što dobijam kao output:
Code: Array
(
[0] => Array
(
[0] => Petroleum gases, liquefied
[1] => 5-15
[2] => 68476-85-7
270-704-2
649-202-00-6
[3] => R12
[4] => F+
[5] => -
[6] => Destilati (nafta), laki, hidrotretirani
[7] => 1-5
[8] => 64742-47-8
265-149-8
649-422-00-2
[9] => R65-66
[10] => Xn
[11] => -
[12] => Bijeli špirit
[13] => 3-7
[14] => 8052-41-3
232-489-3
649-345-00-4
[15] => R65
[16] => Xn
[17] => -
[18] => Solvent naphtha (petroleum), light aliph.
[19] => 15-30
[20] => 64742-89-8
265-192-2
649-267-00-0
[21] => R65-66
[22] => Xn
[23] => -
[24] => ?
)
[1] => Array
(
[0] => Petroleum gases, liquefied
[1] => 5-15
[2] => 68476-85-7
270-704-2
649-202-00-6
[3] => R12
[4] => F+
[5] => -
[6] => Destilati (nafta), laki, hidrotretirani
[7] => 1-5
[8] => 64742-47-8
265-149-8
649-422-00-2
[9] => R65-66
[10] => Xn
[11] => -
[12] => Bijeli špirit
[13] => 3-7
[14] => 8052-41-3
232-489-3
649-345-00-4
[15] => R65
[16] => Xn
[17] => -
[18] => Solvent naphtha (petroleum), light aliph.
[19] => 15-30
[20] => 64742-89-8
265-192-2
649-267-00-0
[21] => R65-66
[22] => Xn
[23] => -
[24] => ?
)
)
Ja mislim da je to ok...
[ Man-Wolf @ 23.09.2009. 15:38 ] @
@Nikola - Nista ne fali tvom kodu, samo, covek je posle pitao, kako da izbegne redove u kojima stoji <th> izmedju <td> tagova ...
@vatri - Malo sam zeznuo kod... evo ga konacno resenje:
Code:
$pat = '/<td[^>]*>((?!<th>).*?)<\/td>/i';
$tekst = '</th></tr></table><table class="tabVL"><tr> <th>Naziv tvari</th> <th>%</th> <th>CAS br.<br>EC br.<br>Index br.
</th> <th>Oznake upozorenja</th> <th>Znakovi opasnosti</th> <th>Broj registracije</th></tr><tr> <td>Petroleum gases, liquefied</td>
<td align="center">5-15</td> <td>68476-85-7<br/>270-704-2<br/>649-202-00-6</td> <td>R12</td> <td>F+</td> <td align="center">-
</td></tr><tr> <td>Destilati (nafta), laki, hidrotretirani</td> <td align="center">1-5</td> <td>64742-47-8<br/>265-149-8
<br/>649-422-00-2</td> <td>R65-66</td> <td>Xn</td> <td align="center">-</td></tr><tr> <td>Bijeli špirit</td> <td align="center">3-7
</td> <td>8052-41-3<br/>232-489-3<br/>649-345-00-4</td> <td>R65</td> <td>Xn</td> <td align="center">-</td></tr><tr>
<td>Solvent naphtha (petroleum), light aliph.</td> <td align="center">15-30</td> <td>64742-89-8<br/>265-192-2<br/>649-267-00-0
</td> <td>R65-66</td> <td>Xn</td> <td align="center">-</td></tr></table><table class="vsebTockeVL3"><tr> <td class="col65">?
</td></tr></table> </td></tr></table><br/><table class="tockaVL"><tr> <th class="tockaVL">';
preg_match_all($pat,$tekst,$ma);
print_r($ma);
Rezultat:
Citat:
Array
(
[0] => Array
(
[0] => <td>Petroleum gases, liquefied</td>
[1] => <td align="center">5-15</td>
[2] => <td>68476-85-7<br/>270-704-2<br/>649-202-00-6</td>
[3] => <td>R12</td>
[4] => <td>F+</td>
[5] => <td align="center">-</td>
[6] => <td>Destilati (nafta), laki, hidrotretirani</td>
[7] => <td align="center">1-5</td>
[8] => <td>64742-47-8<br/>265-149-8<br/>649-422-00-2</td>
[9] => <td>R65-66</td>
[10] => <td>Xn</td>
[11] => <td align="center">-</td>
[12] => <td>Bijeli špirit</td>
[13] => <td align="center">3-7</td>
[14] => <td>8052-41-3<br/>232-489-3<br/>649-345-00-4</td>
[15] => <td>R65</td>
[16] => <td>Xn</td>
[17] => <td align="center">-</td>
[18] => <td>Solvent naphtha (petroleum), light aliph.</td>
[19] => <td align="center">15-30</td>
[20] => <td>64742-89-8<br/>265-192-2<br/>649-267-00-0</td>
[21] => <td>R65-66</td>
[22] => <td>Xn</td>
[23] => <td align="center">-</td>
[24] => <td class="col65">?</td>
)
[1] => Array
(
[0] => Petroleum gases, liquefied
[1] => 5-15
[2] => 68476-85-7<br/>270-704-2<br/>649-202-00-6
[3] => R12
[4] => F+
[5] => -
[6] => Destilati (nafta), laki, hidrotretirani
[7] => 1-5
[8] => 64742-47-8<br/>265-149-8<br/>649-422-00-2
[9] => R65-66
[10] => Xn
[11] => -
[12] => Bijeli špirit
[13] => 3-7
[14] => 8052-41-3<br/>232-489-3<br/>649-345-00-4
[15] => R65
[16] => Xn
[17] => -
[18] => Solvent naphtha (petroleum), light aliph.
[19] => 15-30
[20] => 64742-89-8<br/>265-192-2<br/>649-267-00-0
[21] => R65-66
[22] => Xn
[23] => -
[24] => ?
)
)
[ vatri @ 24.09.2009. 07:38 ] @
i kod mene radi kod takvog teksta, medjutim sada sam probao na drugom nekom tekstu koji ovako izgleda:
Code:
</tr><tr> <td> <table class="tabVL"> <tr><th rowspan="2">Naziv opasne tvari</th><th colspan="2">GVI</th><th colspan="2">KGVI</th><th rowspan="2">BGV</th> </tr> <tr><th>ppm</th><th>mg/m<sup>3</sup></th><th>ppm</th><th>mg/m<sup>3</sup></th> </tr><tr><td>Naftni plinovi, ukapljeni (ako ne sadrži >od 0,1 % 1,3-Butadiena); #naftni plin; #[[Složeni sastav ugljikovodika proizvedenih destilacijom nafte.Sastoji se od ugljikovodika s brojem ugljikovih atoma pretežito u podruÄju C3 do C7 i vrijući u podruÄju približno -40 °C do 80 °C (-40 °F do 176 °F).]]</td><td align="center">1000</td><td align="center">1750</td><td align="center">1250</td><td align="center">2180</td><td align="left" style="width:30%"></td> </tr> <tr><td colspan="6"> GVI – GraniÄne vrijednosti izloženosti KGVI – Kratkotrajne graniÄne vrijednosti izloženosti BGV – bioloÅ¡ke graniÄne vrijednosti</td> </tr></table><table class="vsebTockeVL"><tr> <th>
(3. po redu tag je <td> i izmedju njega i sledeceg </td> sve match-uje, cak ioako postoje th-ovi).
Probao sam sa ovim tvojim patern-om i probao sam izmjenit razliku da bude samo "<th" jer kao sto se vidi ima colspan="2" poslije th-a. Ali ista stvar
taj moj ovako izgleda:
$pat = '/<td[^>]*>((?!<th).*?)<\/td>/i';
a evo sta print_r() vrati:
Code:
PAT: /<td[^>]*>((?!th).*?)<\/td>/i
Array
(
[0] => Array
(
[0] => <td> <table class="tabVL"> <tr><th rowspan="2">Naziv opasne tvari</th><th colspan="2">GVI</th><th colspan="2">KGVI</th><th rowspan="2">BGV</th> </tr> <tr><th>ppm</th><th>mg/m<sup>3</sup></th><th>ppm</th><th>mg/m<sup>3</sup></th> </tr><tr><td>Naftni plinovi, ukapljeni (ako ne sadrži >od 0,1 % 1,3-Butadiena); #naftni plin; #[[Složeni sastav ugljikovodika proizvedenih destilacijom nafte.Sastoji se od ugljikovodika s brojem ugljikovih atoma pretežito u podruÄju C3 do C7 i vrijući u podruÄju približno -40 °C do 80 °C (-40 °F do 176 °F).]]</td>
[1] => <td align="center">1000</td>
[2] => <td align="center">1750</td>
[3] => <td align="center">1250</td>
[4] => <td align="center">2180</td>
[5] => <td align="left" style="width:30%"></td>
[6] => <td colspan="6"> GVI – GraniÄne vrijednosti izloženosti KGVI – Kratkotrajne graniÄne vrijednosti izloženosti BGV – bioloÅ¡ke graniÄne vrijednosti</td>
)
[1] => Array
(
[0] => <table class="tabVL"> <tr><th rowspan="2">Naziv opasne tvari</th><th colspan="2">GVI</th><th colspan="2">KGVI</th><th rowspan="2">BGV</th> </tr> <tr><th>ppm</th><th>mg/m<sup>3</sup></th><th>ppm</th><th>mg/m<sup>3</sup></th> </tr><tr><td>Naftni plinovi, ukapljeni (ako ne sadrži >od 0,1 % 1,3-Butadiena); #naftni plin; #[[Složeni sastav ugljikovodika proizvedenih destilacijom nafte.Sastoji se od ugljikovodika s brojem ugljikovih atoma pretežito u podruÄju C3 do C7 i vrijući u podruÄju približno -40 °C do 80 °C (-40 °F do 176 °F).]]
[1] => 1000
[2] => 1750
[3] => 1250
[4] => 2180
[5] =>
[6] => GVI – GraniÄne vrijednosti izloženosti KGVI – Kratkotrajne graniÄne vrijednosti izloženosti BGV – bioloÅ¡ke graniÄne vrijednosti
)
)
cini mi se da ova "razlika" uopste ne radi :s
P.S. kako da smanjim ovaj [ code ] tag da mi ne siri preko dimenzija sajta?
[Ovu poruku je menjao vatri dana 24.09.2009. u 12:05 GMT+1]
[ Nikola Poša @ 24.09.2009. 10:30 ] @
A čekaj, šta sad recimo fali tom rezultatu kojeg dobijaš sa tim pattern-om kojeg je predložio Mihailo? Ja sad opet ne znam šta sve tačno hoćeš da postigneš...
Citat: vatri: P.S. kako da smanjim ovaj [ code ] tag da mi ne siri preko dimenzija sajta?
Mislim da ta opcija nije moguća.
[ vatri @ 24.09.2009. 11:01 ] @
Vidis li koja je vrijednost $matches[1][0] u mom prethodnom postu?
Tu se nalazi (izmedju ostalog) i "th" tagovi za koje smo rekli da ne smije biti pa me zanima zasto?
Ako ne bude islo da to odradim u paternu, uradicu strpos() ili jos jedan preg_match() svakog clana niza i provjeriti ima li th-ova. Ako ima, izbacim ga iz array-a i rjesen problem.
U svakom slucaju hvala vam obojici puno na trudu, bez vas ko zna kad bi ovo rjesio
I jos jedna vazna stvar koju sam dodao: nedostaje modifikator "s", jer mi onako ignorira celije u kojima ima \n (nova linija)...
[ Nikola Poša @ 24.09.2009. 11:44 ] @
Aha, al' evo onda uzmi u obzir i ovu varijantu:
Code:
$tekst = '</tr><tr> <td> <table class="tabVL"> <tr><th rowspan="2">Naziv opasne tvari</th><th colspan="2">GVI</th><th colspan="2">KGVI</th><th rowspan="2">BGV</th> </tr> <tr><th>ppm</th><th>mg/m<sup>3</sup></th><th>ppm</th><th>mg/m<sup>3</sup></th> </tr><tr><td>Naftni plinovi, ukapljeni (ako ne sadrži >od 0,1 % 1,3-Butadiena); #naftni plin; #[[Složeni sastav ugljikovodika proizvedenih destilacijom nafte.Sastoji se od ugljikovodika s brojem ugljikovih atoma pretežito u podruÄju C3 do C7 i vrijući u podruÄju približno -40 °C do 80 °C (-40 °F do 176 °F).]]</td><td align="center">1000</td><td align="center">1750</td><td align="center">1250</td><td align="center">2180</td><td align="left" style="width:30%"></td> </tr> <tr><td colspan="6"> GVI – GraniÄne vrijednosti izloženosti KGVI – Kratkotrajne graniÄne vrijednosti izloženosti BGV – bioloÅ¡ke graniÄne vrijednosti</td> </tr></table><table class="vsebTockeVL"><tr> <th>';
$pattern = '/<td[^>]*>(.*)<\/td>/Uis';
preg_match_all($pattern, $tekst, $matches);
function ukloniTagove(&$value)
{
$value = strip_tags($value);
}
array_walk($matches[1], 'ukloniTagove');
echo '<pre>'; print_r($matches[1]); echo '</pre>';
I evo šta dobijam kao rezultat u $matches[1]:
Code:
Array
(
[0] => Naziv opasne tvariGVIKGVIBGV ppmmg/m3ppmmg/m3 Naftni plinovi, ukapljeni (ako ne sadrži >od 0,1 % 1,3-Butadiena); #naftni plin; #[[Složeni sastav ugljikovodika proizvedenih destilacijom nafte.Sastoji se od ugljikovodika s brojem ugljikovih atoma pretežito u podruÄju C3 do C7 i vrijući u podruÄju približno -40 °C do 80 °C (-40 °F do 176 °F).]]
[1] => 1000
[2] => 1750
[3] => 1250
[4] => 2180
[5] =>
[6] => GVI – GraniÄne vrijednosti izloženosti KGVI – Kratkotrajne graniÄne vrijednosti izloženosti BGV – bioloÅ¡ke graniÄne vrijednosti
)
Kao što vidiš, nema tag-ova, već samo čist tekst. Al' za to sam ipak morao da upotrebim strip_tags(), a ne regularne izraze. 
[ vatri @ 24.09.2009. 12:48 ] @
da time si dobio i tekst izmedju <th> sto je visak :) U ovom konkretnom slucaju: "Naziv opasne tvariGVIKGVIBGV ppmmg/m3ppmmg/m3"
evo ukratno sta je moj cilj:
dobiti u niz sve sto se nalazi izmedju <td> i </td> pod uslovom da se tu izmedju ne nalaze tagovi za definisanje tabela/elemenata tabela (table, tr, td, th, tbody), NAPOMENA: Izmedju se smije nalaziti prazno polje, npr. ovako <td></td>
Copyright (C) 2001-2025 by www.elitesecurity.org. All rights reserved.
|