[ Stator @ 05.04.2007. 21:15 ] @
Dakle treba bi neki savet kako bi mogao najbolje da kreiram saitmap za jedan moj sajt (Necu sada ovde da stavljam link do njega da ne bude da ga reklamiram). E sada nemam pristup konzoli servera na kome se hostuje taj sajt tako da ne mogu da odradim https://www.google.com/webmast...docs/en/sitemap-generator.html ovo :/

Nasao sam ovaj link http://www.resourceseo.com/sit...=sitemap&url=http%3A%2F%2F koji kao pravi dobre sajtmapove ali nazalost kada njega stavim u onaj google web master tools prijavi mi gomilu gresaka pa je neupotrebljiv.


1. Kako da napravim upotrebljiv sitemap
2. Kako efikasno da ga iztestiram (po mogucstvu da mi ukaze na greske ako su se desile prilikom kreiranja)


thx
[ epitaph @ 18.04.2007. 08:05 ] @
Pogledaj ovo:
http://www.xml-sitemaps.com/st...-google-sitemap-generator.html

Nije besplatan, ali je odličan. Kako je sa sajta moguce kupiti samo preko PayPal-a, zatraži na forumu kupovinu preko e-gold-a (to su meni ponudili) ili moneybookers-a. Brzo indeksira sajt, moguce je podesiti veliki broj parametara, a ima i cron opciju tako da mozes podesiti da sam kreira sitemap-u svakih npr. 7 dana.

Poz.
[ ||NeX|| @ 22.07.2007. 15:27 ] @
Imaš li statičnu ili dinamičnu stranicu?
[ epitaph @ 23.07.2007. 11:38 ] @
Citat:
||NeX||: Imaš li statičnu ili dinamičnu stranicu?

Ako mene pitas, dinamicnu, ali sam linkove posakrivao uz pomoc mod_rewrite, skripra o kojoj sam iznad govorio odlicno indeksira i dinamicne stranice, jedini problem je sto uzima dosta protoka i lagano zablokira sajt za vrijeme indekrisanja jer uzima dosta resursa, zato sam cron nastimao kasno navece (rano ujutro) a sve skupa traje samo 5min.
[ ||NeX|| @ 23.07.2007. 12:08 ] @
@epitaph: Nisam na tebe mislio. Za razne CMS-ove imas genericne Sitemap module koji ti odmah generisu stavku u sitemapu, kada je kreiras. Ovako ti mjenja <lastmod> Tag svaki put i tako gubis na potencijalu. ;)
[ epitaph @ 23.07.2007. 12:38 ] @
Citat:
||NeX||: @epitaph: Nisam na tebe mislio. Za razne CMS-ove imas genericne Sitemap module koji ti odmah generisu stavku u sitemapu, kada je kreiras. Ovako ti mjenja <lastmod> Tag svaki put i tako gubis na potencijalu.

Slazem se, to je ok za CMS-ove, ali meni tako nesto nebi "godilo", jer uz pomoc mod_rewrite-a izdvajam pretrage po gradovima, (u pitanju je fotoOglasnik) i uopste odredjene pretrage ukljucujem u Sitemap-u sto je predpostavljam nemoguce sa rjesenjima koja rade "iznutra", kreiraju sitemap-u iz baze...

Znam da je <lastmod> problem, u skripti sam oznacio "server's response" i uvijek upisuje datum skeniranja, jos u opcijama imam "None" - niste (predpostavljam bez vremena) , "Use current time" - opet vrijeme skeniranja , "Use this date/time" - mogucnost upisa odredjenog datuma...

Mozes li mi poblize objasniti sta mislis pod "gubljenjem potencijala"... Sad sam u nedoumici, da li da totalno iskljucim "lastmod", od prije razmisljem o tome jer mi uvijek upisuje datum skeniranja...
[ ||NeX|| @ 23.07.2007. 14:05 ] @
Bolje ti je da ga iskljucis ukoliko ne mozes ti manipulirati sa njim, tj. ako ih je previse da rucno radis.
U sitemapu bi trebalo poredati po priority, a unutar priority po lastmodu. Tako google-u olaksavas posao i on ako vidi algoritam iza strukture sitemapa od odustaje od ponovnog indexiranja stranica koje su starije od njegove prosle posjete. Faktor starosti je jedan od SEO faktora, ne samo domene, nego i svake stranice pojedinacno.
[ epitaph @ 23.07.2007. 14:28 ] @
Citat:
||NeX||: Bolje ti je da ga iskljucis ukoliko ne mozes ti manipulirati sa njim, tj. ako ih je previse da rucno radis.
..

Iskljucit cu ga. Imam preko 3000 url-ova.

Ipak jedna mi strav nije jasna. Kad google posjecuje moje stranice i njemu ce "server's response" reci da su stranice nove (znaci ni google nema pojma :)), tj. trenutak indeksiranja, onda bi se dalo zakljuciti da google ima svoj parametar koji zapisuje za svaku stranicu, tj. vrijeme prvog indeksiranja stranice, a ako google posjeduje taj parametar onda je potpuno nebitno sta pise u sitemap-i jer se se on vjerovatno koristim svojim zapisom. Ili bar tako nesto :)
[ ||NeX|| @ 24.07.2007. 11:22 ] @
Bas tako, samo sto si jednu stvar zaboravio: update. Po tome google gleda je li ti stranica i kada je updateirana. I onda to uvali kod sebe kao novi datum.
[ bsaric @ 24.07.2007. 11:38 ] @
Jedno pitanje, ako ima search engine friendly linkove što se mučiš sa sitemapom uopće, kaj će ti to?
[ ||NeX|| @ 24.07.2007. 11:55 ] @
Bruno, mislio sam i ja na taj nacin i onda probao staviti u google centralu sitemap da vidim sta ce biti. I primjetih da su me cesce posjecivali i jako brzo indeksirali stranice ako sam ih naveo u sitemapu, vjerovatno na principu: Ok, ovaj ima nase povjerenje. Sada cemo sve indexirati sto napise. Pokusaj, ne skodi sigurno!
[ bsaric @ 24.07.2007. 12:41 ] @
Google indeksira stranice na temelju Google PR, javno objavljena činjenica, što bolji brže i češće indeksiranje, to je jedan od glavnih uvjeta danas, stoga ne vidim razlog da se gubi vrijeme na google sitemaps, to je moje osobno mišljenje.
[ ||NeX|| @ 24.07.2007. 12:46 ] @
Ok, postujem misljenje. Imas URL za tu PR relaciju?
[ bsaric @ 24.07.2007. 12:57 ] @
Misliš link gdje je to objavljeno? Imaš na Matt Cuttsovom blogu par u 5 postova, ali bar 6 mjeseci unazad kad su bile priče o Big Daddy DCu, imaš na SEW članak tj. intervju Matt Cutts sa Danny Sullivanom gdje je to jasno rečeno, imaš na Seroundtable.com pod arhivom praćene seminare od zadnjih godinu dana unazad gdje je to odgovoreno od strane googlea svaki put itd. Ali direktan link mi se sad ne traži :).
[ ||NeX|| @ 24.07.2007. 13:03 ] @
Google izbaci ovo:
http://www.vretoolbar.com/news...10/09/google-pagerank-updated/

i usput saznao ovo:
http://www.webmasterworld.com/forum80/39.htm

:D Hvala
[ ||NeX|| @ 24.07.2007. 13:04 ] @
Eh da, CNN ima PR9, a googlebot je tu svakih 10min. Onako kao orijentir. :D
[ epitaph @ 24.07.2007. 13:34 ] @
Citat:
||NeX||: Ok, postujem misljenje. Imas URL za tu PR relaciju?

Cinjenica je da PR utice na dolaske google pauka, veci PR vise dolazaka.
Citat:
bsaric: Google indeksira stranice na temelju Google PR, javno objavljena činjenica, što bolji brže i češće indeksiranje, to je jedan od glavnih uvjeta danas, stoga ne vidim razlog da se gubi vrijeme na google sitemaps, to je moje osobno mišljenje.

Sitemap-a je korisna u slucajevima gdje pauk mora proci nekoliko stranica da bi dosao do doticne sranice koju treba indeksira.
Primjer: na mom fotooglasniku ponekad dnevno bude postavljeno i 50 oglasa (kad agencije postavljaju oglase), to znaci da google-ov pauk mora proci 5 stranica da bi "obisao" oglas koji je prvi postavljen od tih 50, u rezultatima pretrage prikauje se po 10 oglasa - znaci 5 strana do zadnjeg oglasa. Najvjerovatnije ce google indeksiranje u ovom slucaju uraditi u par dolazaka, nivo po nivo, sa sitemap-om mu ja odamah serviram url-ove novih oglasa tako da nema bespotrebnog indeksiranja koje se moze otegnuti... Nadam se da sam ovo dobro objasnio.
Na ovaj nacin novi oglasi na mom sajtu brzo stizu na google.

Kod stranica koje se ne obnavljaju cesto a uz to imaju dobar PR (npr. 5) sitemap-a nije potrebna...
[ bsaric @ 24.07.2007. 16:45 ] @
Citat:
Sitemap-a je korisna u slucajevima gdje pauk mora proci nekoliko stranica da bi dosao do doticne sranice koju treba indeksira.


Možeš to gledat tako, ali možeš i ovako, sa stranicom koja je toliko duboko od početne rijetko možeš nešto, možeš ako imaš jak PR, ak nemaš ništa, a sa druge strane koliko god "neimala" snage neki PR se proslijeđuje i oduzima od nivoa više, drugim riječima gubiš PR na višim nivoima ak imaš puno dubokih stranica, u tom slučaju bolje ih je neindeksirat.

:)
[ epitaph @ 24.07.2007. 17:06 ] @
Nebih se slozio da se gubi PR ako su linkovi unutar jednog domena. Imam cvrst PR 5 u svim google data centrima a imam ogroman broj novih stranica sto kreiranih od korisnika (oglasa) sto sa moje strane (izdvojenih pretraga)... Veliki broj stranica posjeduje page rank 4 i 3...
[ Prokleta_Nedelja @ 24.07.2007. 17:29 ] @
Da li postoji neko razumno ogranicenje broja linkova u sitemapu? Da li mogu da stavim 20.000 linkova? Mozda to google sankcionise... u stvari vjerovatno je tako samo nisam siguran
[ bsaric @ 24.07.2007. 17:53 ] @
Citat:
Nebih se slozio da se gubi PR ako su linkovi unutar jednog domena.


Onda trebaš pročitat orginalni patenat vezan uz PR koji kaže da upravo tako funkcionira, nisam to ja izvukao iz iskustva.

Ako ti početna ima PR5, unutarnje na jednom kliku od početne imaju najvjerojatnije PR4 i PR3, na dva klika od početne PR3 i PR2, tri klika od početne PR1, 4 klik od početne 0, 5 klik 0. To je primjer samo, ali na taj način funkcionira PR, sa klikom opada jer se širi na sve više i više unutarnjih stranica. Vrlo je teško sa 5 nivom rangirat se za prosječni sajt. PR5 spada u prosjek, možda malo više od prosjeka.
[ ||NeX|| @ 25.07.2007. 17:30 ] @
@bsaric: Rand je pisao jednom o tome. Naravno da stranica ne treba ići u dubine, nego u širinu. Jedan od razloga je i taj koji si ti naveo.

@Prokleta_Nedelja: Nema ograničenja. Ima stranica po 5 miliona imaju u sitemapu. Kao recimo CNN i BBC.
[ Prokleta_Nedelja @ 26.07.2007. 09:46 ] @
takodje jos me interesuje da li je bolje da na root-u ostavim sitemap.xml ili da ga gzipujem i stavim na root kao sitemap.xml.gz? Koje od te dvije kombinacije vise odgovaraju obzirom da mi je sitemap raspakovan tezak 4Mb? Da li google moze preuzeti gzipovan sitemap? Mislim da ce mi se smanjiti potrosnja protoka ako gzipujem.
[ epitaph @ 26.07.2007. 11:27 ] @
Slobodno gzip, meni sitemap-u skripta gzip-uje i obavjesti google i on je normalno procita.

To je 100% sigurno jer sam provjerio na www.google.com/webmasters/sitemaps - normalno prepoznaje sitemap.xml.gz mapu i linkove u njoj.
Moja mapa bez gzipa je oko 750Kb, a gzip-ovana 29Kb! Ogromna razlika...
[ Milan Tomin @ 31.07.2007. 21:48 ] @
Ja uvek postavljam ne kompresovanu XML mapu.
Koliko znam ne cita je samo google, tako da... sto je sigurno - sigurno je.
[ djdacha @ 08.08.2007. 20:09 ] @
Heh ogranicenje, zeznuto pitanje. Ja sam isao do 2000 i vise nema frke, e sada dalje..
A ovaj http://www.xml-sitemaps.com/ nudi free sitemap do 500 linkova, sto je ok za manje sajtove.