[ Subgate @ 13.08.2002. 18:33 ] @
| [Sun Aug 11 07:13:33 2002] [error] [client 66.147.154.3] File does not exist: /VDOMAINS/dario/web/www/robots.txt
Stalno mi na sajtu prijavljuje da taj fajl ne postoji....
Za sta sluzi taj fajl i sta u njega da stavim ????
|
[ McKracken @ 14.08.2002. 02:13 ] @
Citat:
[Sun Aug 11 07:13:33 2002] [error] [client 66.147.154.3] File does not exist: /VDOMAINS/dario/web/www/robots.txt
Stalno mi na sajtu prijavljuje da taj fajl ne postoji....
Za sta sluzi taj fajl i sta u njega da stavim ????
U njemu treba da se nalaze definicije sta sme a sta ne sme da se indeksira, i kako. To je fajl koji otvara spajder kada pokusava da indeksira tvouju stranu (npr googlebot). Obican je tekstualni fajl, a njegov opis mozes da nadjes ovde:
www.robotstxt.org
[ Divjak @ 14.08.2002. 02:14 ] @
[ Subgate @ 14.08.2002. 18:45 ] @
# Moj prvi pokusaj da nesto kazem robotima.....
User-agent: *
Disallow: /cgi-bin/
User-agent: *
Disallow: /buttons/
# tu ima 200 flash dugmica i tu mi ne trebaju pauci ?!?
/*** Pogledah preporucene stranice i shvatih sa su to "roboti"...
zabranio sam im ova dva direktorijuma jer tu u principu nemaju sta da traze.
Koja je prednost ovoga zabranjivanja ? Jedina korist koliko sam ja skapirao je
nesto manja opterecenost sajta robotima koi ga pretrazuju...jer ne pretrazuje direktorijume u kojima nema sta da nadje korisno... Ima li jos neki drugi dobar razloga za postavljanje
ovog fajla na sajt ??? ***/
[ NetworkAdmin @ 15.08.2002. 22:33 ] @
Naravno da ima razloga! Nemamo svi /data/ direktorij ispod dicumentroota pa moramo drzati data/passwordsghr5z5667.txt u nekom direktoriju gore... e sada ako slucajno spider prateci referale negdje nadje taj file bas bi bilo interesantno, naravno govorim o bezze fajlovima sa passwordima recimo za forum...
[ tOwk @ 20.08.2002. 06:00 ] @
Loš dizajn i organizacija stranice ne opravdava upotrebu robots.txt. Čak, ukoliko je jedan ,,neinteligentni'' robot uspeo da pronađe taj fajl sa lozinkama, svakako će moći i ,,nadprosečna'' budala iz ljudskog roda.
Prema tome, prvi korak u zaštiti takvih fajlova su ,,chmod go-rw'' ako se skripte izvršavaju sa našim korisničkim identitetom, i ne postojanje reference na taj fajl u bilo kom fajlu (ali ovo je opet opasna ,,sigurnost pomoću zbrke'').
A robots.txt ima nekoliko osnovnih namena:
--- da spreči robote da preopterete server
--- da spreči posećivanje dinamički generisanih strana čiji sadržaj zavisi od posetioca (webmail klijenti i slično)
--- da omogući kontrolu ,,inteligencije'' robota, i da ih ne pustimo da idu na dinamičke stranice kojima nema kraja (npr. neki kviz baziran na slučajnom izboru i slično)
--- da omogući indeksiranje samo podataka koji se ne menjaju suviše često (inače će biti indeksirani neispravni podaci)
Ovo su najverovatnije i jedine opravdane namene za robote koji su dobro napravljeni (tj. koji poštuju robots.txt).
Toliko
[ Aleksandar Marković @ 17.12.2004. 12:39 ] @
[ Aleksandar Marković @ 23.08.2006. 21:53 ] @
Copyright (C) 2001-2025 by www.elitesecurity.org. All rights reserved.