[ samilen @ 24.01.2008. 18:41 ] @
Nisam uspeo pomoću JAXP biblioteke da konvertujem *.xml fajl u *.txt fajl. Novi fajl ne treba da ima tagove, nego samo ono između njih. Moguće je da je i xml malo faličan jer mu fali DTD. Evo primera ovog xml fajla:
Code:
<?xml version="1.0" encoding="UTF-16" standalone="no"?>
<zylab>
  <document version="1.1">
        <fields>
            <field id="Naziv">Test1</field>
            <field id="Evidencioni_broj">Test1</field>
            <field id="Datum">20071001</field>
            <field id="Smer">Dolazni</field>
        </fields>
        <objects>
      <object id="1">
        <link type="image" date="20071001" time="14:33:42.00" size="59361">000000QA.tif</link>
        <text>
          <l/>
          <l>    Red 1 ćiriličnog UTF-16 teksta</l>
          <l>Drugi red </l>
          <l>     treći red</l>
          <l>         Može i latinica </l>
          <l>A može i mešano</l>
          <l> a ima i ćoškastih zagrada: <<ura!>> </l>
          <l>I tako do kraja dokumenta</l>
        </text>
      </object>
    </objects>
  </document>
</zylab>

Problem je što ne znam da ga isparsiram na pravi način. Mogao bih ručno, ali šta ako ima tagove u sred teksta? Bar mi dajte neki hint kako da pročitam tekst između tagova.

Svuda ima primera kako da se konvertuje nešto u xml, ali kako da konvertujem iz xml-a u nešto pitanje je sad?
[ augustus @ 24.01.2008. 21:18 ] @
Bez imalo googlanja na pamet mi pada da parsiras dom-om pa da trpas tekst u file. Ako se nadje tag u tekstu unutar regularnig taga onda mozes svaku vrednost isparsiranu dom-om proveriti da li sadrzi tag unutar sebe....
[ ph4t @ 07.02.2008. 20:08 ] @
U XQuery imas funkciju "data" koja radi bas to sto zelis. Sa saxon bi to trebao moci napraviti.