Pomoc oko DomXPath

[ ntesic @ 22.04.2011. 21:16 ] @

Imam ovakav HTML kod:

Code:

<div id="centercont" align="justify">
<div style="padding-top:8px;">
<a href="/">
<b>site.com</b>
</a>
» »
<a href="http://">
<b>Something</b>
</a>
» »
<b>Something</b>
</div>
<h3 class="itemheadind">

HEADER
</h3>
<center>
<b>Subtitle</b>
</center>
<br/>
<table width="336" cellspacing="0" cellpadding="0" border="0" align="right">
<tbody>
<tr>
<td width="336" valign="top" align="right">
<br/>
<br/>
</td>
</tr>
</tbody>
</table>
TEXT1
<br/>
<br/>
TEXT2
<br/>
<br/>
TEXT3
<br/>
<br/>
TEXT4
<br/>
<br/>
TEXT5
<br/>
<br/>
TEXT6
<br/>
<br/>
ITD...
<br/>
<br/>
<br/>
</div>

E sada kako da uspem da izvucem samo TEXTove. Probao sam sa raznim varijantama excludova i neuspevam. Da li je moguce odraditi ovo?

[ Nikola Poša @ 22.04.2011. 21:41 ] @

Pa u tom slučaju je možda lakše ići sa nekim regex-om, pošto se to što želiš da iščupaš nalazi na prvom nivou tog dokumenta. Ok, mogao bi i da foreach-om obilaziš $childNodes tog dokumenta (samo taj prvi nivo) i da onda ispituješ da li je tekući element jednak XML_TEXT_NODE i da li je $nextSibling->nodeName == 'br', kako bi utvrdio da si na onome što ti treba. Ali ja mislim da je lakše da sastaviš neki ovakav regularan izraz: /(?:>)?(.+)\s*<br\/>/U.

[ ntesic @ 22.04.2011. 21:48 ] @

Problem je sto je ovo samo deo HTML koda, tako da sa regex funckijom za <br> dobijam i ono sto mi ne treba iz celog dokumenta. Ceo kod je regularan, sa HEAD, BODY i ostalim tagovima.

[ ntesic @ 22.04.2011. 22:11 ] @

Uspeo sam sa ovim queryjem:

$xpath->query(".//div[@id='centercont']/text()")