[ Iznogud @ 03.07.2006. 12:36 ] @
Kao sto i naslov kaze desilo se (vec drugi put) da je jedna radna stanica onemogucila komunikaciju unutar cele mreze. Mreza je segmentirana, pojedine lokacije/zgrade imaju lokalne segmente i na glavni rack su konektovani opickim kablom (dakle u centarlno cvoriste). Desilo se da je jedan PC tacnije kvar na njegovoj mreznoj kartici onemogucio celu komunikaciju u mrezi. Diskonektovanjem tog segmenta/zgrade ponovo bi se omogucila komunikacija. (Vizuelna indikacija na switchevima bila je takva da su sve lampice naprosto ludacki blinkovale - kad nije bilo komunikacije)
E sad, mene zanima kako je to uopste moguce? Imamo oko 200 radnih stanica, dakle 200 potecijalnih mrezo-ubica.
U mrezi se koriste Allied Telesyn AT-8326GB switchevi vezani u stack. Oni imaju module za takozvane GBIC-eve preko kojih se vezu drugi segmenti putem optickog kabla (dakle, GBIC=pretvara opticki u elektricni signal).
Zar je moguce da neispravnost jednog mreznog adaptera baci na noge celu mrezu, prosto nisam mogao da poverujem. Kako je moguce da switch automatski ne izbaci tu granu, a ne da se problem prenese i na ostale segmente.
Sta je resenje u ovakvim situacijama? Jeli imao neko slican problem?

Evo nekih od karakteristika switcheva Allied Telesyn AT-8326GB:

￿ 24 10/100Base-TX ports with RJ-45 connectors
￿ Two 10/100/1000Base-T ports with RJ-45 connectors
￿ Auto-MDI/MDI-X on all twisted pair ports
￿ Auto-Negotiation for speed and duplex mode (IEEE 803.3ucompliant)
￿ Two slots for Gigabit Interface Converter modules
￿ Two stacking ports
￿ Port trunking and port monitoring
￿ Port security
￿ Dynamic Host Configuration Protocol
￿ Internet Group Management Protocol snooping
￿ AT-S41 management software
￿ Port-based and tagged VLANs (IEEE 802.1Q-compliant)
￿ Spanning tree protocol (IEEE 802.1d-compliant)
￿ Quality of Service (IEEE 802.1p-compliant)
[ VRider @ 03.07.2006. 12:52 ] @
Nesto je tu zestoko lose podeseno...
[ Iznogud @ 03.07.2006. 12:56 ] @
Citat:
VRider: Nesto je tu zestoko lose podeseno...

A sta moze biti lose podeseno???
[ VRider @ 03.07.2006. 13:01 ] @
Ne znam, i ja jedva cekam da cujem...
[ Gojko Vujovic @ 03.07.2006. 15:45 ] @
Da je neki cisco, trazio bih ti debug output i log fajl, pa da probamo da kazemo u cemu je bio problem.

Ovako mozemo samo da se gledamo, osim ako ne naidje neko ko zna da dobije slicne informacije od AT switcheva.
[ Iznogud @ 03.07.2006. 19:30 ] @
Citat:
Gojko Vujovic: Da je neki cisco, trazio bih ti debug output i log fajl, pa da probamo da kazemo u cemu je bio problem.


E sad, kad smo radili mrezu bio je cisco u igri, ali mu je cena bila i do 3 puta veca (za managed switcheve). Sad da li smo pogresili ili ne... sta je tu je...

Svejedno, ne mogu da shvatim sta moze da uzrokuje zauzece cele mreze. Pade mi napamet da nesipravna kartica salje neki broadcast bez prekida pa mozda time blokira celu mrezu!? Da li je to uopste moguce?? Kakav bi drugi signal u mrezi blokirao ostale hostove???

[ markom @ 03.07.2006. 22:13 ] @
... sad ti je jasno zašto Cisco košta 3x više :-). S njim bi neke stvari bile nešto malo jasnije :-).

Marko.
[ Marcony @ 03.07.2006. 22:40 ] @
Za pocetak probaj da saljes broadcast sa nekog kompa pa vidi sta se desava.
[ Ivand @ 03.07.2006. 23:39 ] @
Ludovanje lampica na swicevima moze da bude posledica broadcast storma http://en.wikipedia.org/wiki/Broadcast_storm .
Ali opet i mnoogo drugih stvari. Za pocetak bi proverio da li postoje redudantni vodovi u fizickoj topologiji, pa da li je STP podesen da
radi na svim svicevima na istoj verziji .... Ali opet moze da bude i nesto sasvim 10to.
[ whitie2004 @ 04.07.2006. 07:00 ] @
Mrezna karta ??

Meni vise lici da je neko dobio malu platu pa je pustio duha iz boce. Da bi napravio ovakvu stetu treba mu znanje i privilegije sistema.
[ tarla @ 04.07.2006. 07:47 ] @
^^^ True

I sto malo ne bi "preslusao" mrezu etheralom ili necim slicnim ili malo rastavio na vise segmenata da onda studirao
[ someone_bl @ 04.07.2006. 08:14 ] @
Mrezna Karta nema sanse da je prouzrokovala ovako nesto...

Gledao sam kad virus ili neki drugi maliciozni kod ubije cisco 3700, 2600, 1800... kao zeca... ne mozes ni da se telnetujes na njega.... ali da mrezna karta moze toliko da zasmeta sumnjam...


Pricas o odvojenim mreznim segmentima i upravljivim switchevima ... predpostavljam da imas VLAN-ove i rutiranje izmedju njih, tako da mi i nije bas jasno kako "Broadcast storm" mogao da utice na sve... Mislim nije nemoguce ali opet .... ne moze tek tako ....
[ Milan Andjelkovic @ 04.07.2006. 08:15 ] @
Spominješ da je mreža segmentirana. Da li pod tim misliš da je segmentirana ruterima, ili nešto drugo? Ako je segmentirana ruterima, onda nije u pitanju broadcast storm.

Btw. jel ovo beše ona mreža sa ethernet kablovima od 150m, pravljena uz filozofiju "što bismo poštovali standarde, kad i ovako radi bez problema"?
[ Iznogud @ 05.07.2006. 06:37 ] @
Citat:
Milan Andjelkovic: Spominješ da je mreža segmentirana. Da li pod tim misliš da je segmentirana ruterima, ili nešto drugo?

Nije segmentirana ruterima. Pod segmentiranjem mislim da su pojedinis segmenti su povezani na master rack optikom (obzirom da su udaljeni 500-1000m)

Citat:
Milan Andjelkovic: Btw. jel ovo beše ona mreža sa ethernet kablovima od 150m, pravljena uz filozofiju "što bismo poštovali standarde, kad i ovako radi bez problema"?

Ma kakvi. Mreza je korektno uradjena uz postovanje tih standarda.

Cinjenica je da je jedan PC uzrokokovao ovaj problem jed njegovim skidanjem sa mreze sev je ponovo bilo OK (testa radi kad smo ga vratili opet je mreza poludela). E sad, sta je bilo sa tom radnom stanicom nisam siguran, virus, mrezna ili nesto trece, sve jedno je... Ne mogu da shvatim da to moze uzrokovati jedna stanica.
Doduse, proveravao sam samo komunikaciju u segmentu gde je bila problematicna stanica i master segment (da ga tako nazovem jer tu su serveri). I ta komunikacija nije radila kao ni komunikacija ostalih segmenata sa ovim tzv. master segmentom. Moguce je da je sve bilo OK unutar ostalih segmenta ali oni snisu mogli da komuniciraju sa serverima (u to sam siguran).
[ Marcony @ 05.07.2006. 07:00 ] @
Mozes li da testiras taj PC da vidis u cemu je problem? Za ubuduce, ako se bude desavalo.
[ Iznogud @ 05.07.2006. 12:31 ] @
Ma PC je sada OK, zamenjena kartica i reinstaliran OS i sada je sve OK. Nije on poenta.

[Ovu poruku je menjao Iznogud dana 06.07.2006. u 07:25 GMT+1]
[ tarla @ 06.07.2006. 01:06 ] @
bas cudno.. zivo me interesuje kako i sta je bilo.
[ Dejan Djurovic @ 26.07.2006. 20:39 ] @
Vidim da je kasno, posto si vec uradio format c: al ajde da napisem, ako si vec sumnjao da je OS u pitanju a ne hardware/ski problem. Mogao si da pogledas u Event viewer/u (Application, Security, System, Antivirus, IE ... sve u zavisnosti od OS/a) kako se ponasao rachunar za vreme rada i nakon obaranja mreze od strane njega, mozda bi nesto i mogao da saznas uz pomoc tih log fajlova.
[ velibor @ 08.08.2006. 09:29 ] @
U mreži isto imam dva stacka sa ukupno 6 komada AT-8326GB i sve radi bez problema pune tri godine premda je u međuvremenu bilo dosta "prolupanih" mrežnih kartica. Jedni slučaj kada se kompletna mreža zaglupila na način koji opisuješ jeste kada je na jednom računaru pokrenut Foundstone SuperScan 4.0 u režimu brzog skeniranja mreže. Zato sam sklon da se složim sa ostalima koji kažu da je najverovatnije ljudski faktor uzrok problema.
[ SleepLess @ 21.08.2006. 10:35 ] @
zasto mislim da je neki opticki kabl izazvao sve ovo zbog lose refleksije signala. moj ti je savet da prvo proveris opticku kablazu i konektore. jer ovde je najverovatnije u pitanju neki overload mreze a to je lako da se desi kod optickih kablova. ja sam imao slican problem dok sam radio u kablovskoj televiziji. meni je matrix koji mi je bio u jednom cvoristu zasluzan za mapiranje kanala s i c podrucja totalno bio pobenavio. a problem je bio ( da ne poverujes) u glupavom elektro-optickom rx-u, tacnije u ostecenom konvertoru. pusti neki programcic (ako imas) i pokusaj da detektujes nivo suma na mrezi. kreni segment po segment ali od stack-a i pustaj test signal kroz optiku. tamo gde ti se pojavi sum veci nego sto treba proveri ovo sto sam ti gore napisao. samo jos jedan mali podatak. zrno prasine velicine 1 mikrometar moze da izazove ostecenje signala za ceo 1dB. dovoljno je da poludi jedan konektor pa da to ode dalje.

poz.

p.s. javi sta si uradio.
[ dpop @ 21.08.2006. 11:15 ] @
Nije promptno ... ali može da koristi...
Ovo je po meni, primarno, net-monitoring problem na enterprise nivou mreža, kakva je ova o kojoj je riječ, definitivno. Radim na većoj, sa sličnom opremom i bez Cisco-a a sa fiber-optic pristupnom mrežom sa 30 lokacija i preko 60 statičkih podmreža sa 4 Mb ka net-u. Postoji i jedan veliki wireless segment sa Proxim-Tsunami opremom ....Napomenuću da FW opcija na AT switching opremi nije aktivirana/dokupljena.
Dešavalo se da samo jedan Gnutella P2P server koji je prošvercovan, dođe glave ostalim korisnicima dok se nije stavio na ulaz jedan Fortinet-ov Fortigate 300A sa Intrusion Protection funkciom koji je ukazao na izvor-e zla.... i elegantno ih srezao....
Postoje jako dobra rješenja za nadzor resursa tipa Nagios, Cacti/RRDTool/Mrtg i sl.. koji se sreću pod razliičitim imenima a meni najnovije je sa
http://www.careless-network.org/Presentation
koje je lako uz FoxLingo firefox plugin prešla sa FR na EN i vrijedi ga pregledati i sjetiti se nekadašnjeg sličnog http://sentinix.tigerteam.se ....
Inače, o ovim alatima je već par puta bilo riječi, a stvar je da se ili uzme turn-key recimo apliance rješenje ili da se net-admini malo aktiviraju po tom pitanju....