[ ntesic @ 22.04.2011. 21:16 ] @
Imam ovakav HTML kod:
Code:

<div id="centercont" align="justify">
<div style="padding-top:8px;">
<a href="/">
<b>site.com</b>
</a>
 » » 
<a href="http://">
<b>Something</b>
</a>
 » » 
<b>Something</b>
</div>
<h3 class="itemheadind">

HEADER
</h3>
<center>
<b>Subtitle</b>
</center>
<br/>
<table width="336" cellspacing="0" cellpadding="0" border="0" align="right">
<tbody>
<tr>
<td width="336" valign="top" align="right">
<br/>
<br/>
</td>
</tr>
</tbody>
</table>
TEXT1
<br/>
<br/>
TEXT2
<br/>
<br/>
TEXT3
<br/>
<br/>
TEXT4
<br/>
<br/>
TEXT5
<br/>
<br/>
TEXT6
<br/>
<br/>
ITD...
<br/>
<br/>
<br/>
</div>


E sada kako da uspem da izvucem samo TEXTove. Probao sam sa raznim varijantama excludova i neuspevam. Da li je moguce odraditi ovo?
[ Nikola Poša @ 22.04.2011. 21:41 ] @
Pa u tom slučaju je možda lakše ići sa nekim regex-om, pošto se to što želiš da iščupaš nalazi na prvom nivou tog dokumenta. Ok, mogao bi i da foreach-om obilaziš $childNodes tog dokumenta (samo taj prvi nivo) i da onda ispituješ da li je tekući element jednak XML_TEXT_NODE i da li je $nextSibling->nodeName == 'br', kako bi utvrdio da si na onome što ti treba. Ali ja mislim da je lakše da sastaviš neki ovakav regularan izraz: /(?:>)?(.+)\s*<br\/>/U.
[ ntesic @ 22.04.2011. 21:48 ] @
Problem je sto je ovo samo deo HTML koda, tako da sa regex funckijom za <br> dobijam i ono sto mi ne treba iz celog dokumenta. Ceo kod je regularan, sa HEAD, BODY i ostalim tagovima.
[ ntesic @ 22.04.2011. 22:11 ] @
Uspeo sam sa ovim queryjem:

$xpath->query(".//div[@id='centercont']/text()")