[ franjo_tahi2 @ 27.02.2014. 09:16 ] @
Treba mi, ako je uopće moguće:
- na strnicu (konkretno: https://sudreg.pravosudje.hr/registar/f?p=150:1) upisati OIB ili MBS
- učitati podatke koje stranica generira (podaci o poduzeću ili obrtu)

Da li je to moguće direktno, bez dogovora sa programerima koji rade stranicu ili mi oni moraju prirpemiti podatke?
Kojim putem krenuti?
[ franjo_tahi2 @ 27.02.2014. 11:22 ] @
Našao sam manje - više sve što mi je trebalo (ostavit ću ovdje kasnije source testa - možda kome zatreba)
Još imam jedan problem. Ne mogu učitati povratne podatke... mogu ali preko txt-a, traženjem tag-ova i sl.
Da li postoji način da se učita? Shvatio sam da je razulatat u tablici.
Ovo je dio koda stranice s podacima koji mi trebaju:

Code:

input type="hidden" name="p_arg_names" value="941028960466219895" /><input type="hidden" name="p_t11" id="P2_URL_ODABRAN" value=""><input type="hidden" name="p_arg_names" value="941028574420219893" /><input type="hidden" name="p_t12" id="P2_MBS_ODABRAN" value=""><div id="report_1231467541663649784_catch"><style>
.nodatafound {align: center;}
</style>
<table cellpadding="0" border="0" cellspacing="0" summary="" align="center"  id="report_R1231467541663649784"><tr><td></td></tr>
<tr>
<td><table cellpadding="0" border="0" cellspacing="0" summary="" class="report-standard">
<tr ><th id="MBS" class="header">MBS</th><th id="OIB" class="header">OIB</th><th id="SUD_NAZIV" class="header">Sud</th><th id="SBT_AKT" class="header">Status</th><th id="TTA_IME" class="header">Naziv / Ime subjekta</th><th id="TTA_AKT" class="header">Status naziva</th><th id="ADRESA" class="header">Adresa</th></tr>
<tr class="highlight-row"><td headers="MBS" class="data"><a href="f?p=150:28:0::NO:28:P28_SBT_MBS:080462348" >080462348</a></td><td headers="OIB" class="data"><span style="font-weight: bold; color: red;">24146311117</span></td><td headers="SUD_NAZIV" class="data">TS Zagreb</td><td headers="SBT_AKT" class="data">Aktivan</td><td headers="TTA_IME" class="data">BLITZ - CINESTAR, društvo za kinoprikazivačke usluge, d.o.o.</td><td headers="TTA_AKT" class="data">Aktivno</td><td headers="ADRESA" class="data">Zagreb, Lanište 32</td></tr>
</table><div class="CVS"></div></td>
</tr>
<tr><td colspan="7" align="right" ><table summary=""><tr><td class="pagination"></td><td class="pagination"></td><td nowrap="nowrap" class="pagination"><span class="fielddata">redak 1 - 1 od 1</span></td><td class="pagination"></td><td class="pagination"></td></tr></table></td></tr>
</table></div></td>
        <td class="tbl-sidebar"></td>     
      </tr>
    </tbody>
  </table>
</div><
[ savkic @ 27.02.2014. 17:35 ] @
Koliko vidim ovo je neki html format, treba ti neki html parser. Ili sam da ga pises ili da iskoristis neki, pogledaj recimo TJvHTMLParser iz JVCLa, on je jedan od jednostavnijih a olaksava posao.
[ komplikator @ 03.03.2014. 14:16 ] @
Kolege iz bivše firme su imali genijalnu ideju za sve i svašta vući pdoatke sa web-a. Naravno, ne kroz servise tipa SOAP-a. ili preko REST-a. negu upravo kako i zamišljaš - parsirajući HTML.
Nakon nešto vremena ili su završili na blacklistama servera (valjda po identifikaciji clienta), a jednog dana su dobili i "pravno formulirano upozorenje". Na kraju su odsutali od te "igračke".

Direktno uglavnom možeš raditi s nekim cachiranim podacima (npr. tečajna lista, vremenska prognoza i sl.), no za direktne upite vjerojatno trebaš ozbiljniji pristup i dogovor.
Toplo ti preporučujem direktan kontakt sa programerima i dobar dogovor oko toga što se i koliko smije koristiti. Sve što je ozbiljno i "valja" ima već riješen neki od oblika web servisa gdje izbjegavaš parsiranje i triper kombinacije koje će se raspasti kod slijedećeg redizajna stranice ili malo igranja kôdom.
[ captPicard @ 07.08.2014. 10:58 ] @
franjo jesi uspio ovo rješiti? Ako da, može mala pomoć kako? :)
Hvala.
[ franjo_tahi2 @ 14.08.2014. 10:43 ] @
GO, goto na žalost :(

Riješio sam parsanjem html-a, nije tako teško, ali niti dobro.
Program radi (trenutno), ali bilo koja izmjena na stranici naziva var ili gumba - gotovo.

Kontaktirao sam sa vlasnicima stranice. Problem je što zakonski što tromost (nešto novo?) naše administracije.
Rješenje je zvati ih, slati mail-ove i to što češće da ih se natjera na izmjene.

Uglavnom, odgovor koji sam dobio, u kratko:
... za sada ništa, radi se izmjena zakona... bit će omogučeno uz plaćanje...
[ captPicard @ 18.08.2014. 14:47 ] @
Svejedno hvala franjo!
[ tkaranovic @ 19.08.2014. 05:40 ] @
Evo kako moze ako se koristi WebBrowser... sto naravno isto ne radi ako se promeni naziv...


Code (delphi):

var
  HtMLDocument2: IHTMLDocument2;
  element: IHTMLelement;
  tekst: WideString;
begin
  if MainForm.ActiveMDIChild = nil then
    Exit;
  HtMLDocument2 := TIEProzorF(MainForm.ActiveMDIChild).WebBrowser1.Document as IHTMLDocument2;
  if HtMLDocument2 <> nil then
  begin
    element := HtMLDocument2.all.Item('ImeElementa',0) as IHTMLelement;
    if element <> nil then
    begin
      tekst := element.outerHTML;
      if pos(WideString('value=""'), tekst) > 0 then
        insert('neki tekst', tekst, pos(WideString('value='), tekst)+7)
      else
        insert(' value="neki tekst"', tekst, length(tekst));
      element.outerHTML := tekst;
    end;
...