[ Nedeljko @ 23.06.2011. 10:29 ] @
[ Nedeljko @ 23.06.2011. 10:29 ] @
[ djoka_l @ 23.06.2011. 10:54 ] @
Režim zaokrugljivanja se postavlja setovanjem FPU Control Registra na odgovarajuću vrednost.
Pogledaj: http://www.arl.wustl.edu/~lock...rtofasm/Chapter_14/CH14-3.html Nezavisnost režima zaokruživanja između procesa se postiže time što se FPU Control Registar čuva prilikom prekida procesa (u kontekstu procesa). Čuvanje ovog registra nije "automatsko" nego je odgovornost OS-a da sačuva ono što je bitno, tako da za čuvanje "konteksta niti" koje nije direktno podržano u delu koji se tiče FPU CR moraš sam da se pobrineš, tj. da koristiš semafore. [ Nedeljko @ 23.06.2011. 11:05 ] @
Hvala na odgovoru, ali mislim da nisi pažljivo pročitao pitanje pod A).
Sve je to lepo na jednom jezgru, gde jedan proces mora biti prekinut da bi drugi radio, ali šta u slučaju višejezgarnih procesora? Recimo, imaš 10 procesora sa po dva jezgra. Jezgra jednog od procesora izvršavaju neka dva procesa, a ostalih 9 procesora obavljaju sve ostalo. Dakle, ta dva procesa se ne prekidaju nikada i izvršavaju se na istom procesoru. Kako onda ne utiču jedan na drugog? Što se semafor atiče, nisam te baš razumeo. Ja sam problem rešio preko mjuteksa. [ djoka_l @ 23.06.2011. 11:11 ] @
Ok, da probam da dopunim odgovor.
Nije mi poznato koliko FPU-a imaju višejezgarni procesori, ali možemo da pretpostavimo da ih ima manje nego jezgara (u slučaju da ih ima isto, rešenje je trivijalno - svako koristi svoj FPU). Dakle, rešenje je isto kao i kod korišćenje bilo kog deljenog resursa - resurs se dodeli, koristi pa onda pusti. Pre dodele FPU-a procesu, snimi se kontekst FPU-a, pa se vrati kada ga ponovo dobije prekinut proces. U tvom primeru, 10 procesora sa po 2 jezgra, svaki od procesora ima bar po jedan FPU. Svaki proces koristi FPU koji se nalazi na onom procesoru čije jedno jezgro izvršava proces. A pretpostavka da se dva procesa ne prekidaju nikad nije tačna. Ako bi sistem dozvolio da neki proces može da radi neprekidno, tada ne bi bilo ništa od multitaskinga, a svako bi mogao da napiše program koji ekskluzivno koristi jezgro. [ deerbeer @ 23.06.2011. 11:13 ] @
Pogledaj ovde ces mozda naci dobre alatke za rad sa multicore jezgrima.
http://software.intel.com/en-u...es/intel-parallel-studio-home/ [ Nedeljko @ 23.06.2011. 11:30 ] @
Citat: djoka_l: A pretpostavka da se dva procesa ne prekidaju nikad nije tačna. Ako bi sistem dozvolio da neki proces može da radi neprekidno, tada ne bi bilo ništa od multitaskinga, a svako bi mogao da napiše program koji ekskluzivno koristi jezgro. Kako ništa od multitaskinga, kad imaš još 9 procesora? [ djoka_l @ 23.06.2011. 11:31 ] @
Još jedna dopuna:
Na slici: http://en.wikipedia.org/wiki/File:Intel_Core2_arch.svg se vidi da ipak svako jezgro ima svoj FPU, tako da je slučaj trivijalan (ako sam dobro protumačio sliku).... [ Nedeljko @ 23.06.2011. 11:37 ] @
A zašto onda nije sređeno da niti ne utiču jedna na drugu?
[ djoka_l @ 23.06.2011. 11:46 ] @
http://www.cafeaulait.org/course/week11/02.html
Snimanje i vraćanje konteksta procesa je skupa operacija. Zato su i izmišljene niti, imaš paralelizam, s tim da niti dele neke resurse. Citat: Nedeljko: Kako ništa od multitaskinga, kad imaš još 9 procesora? Neka imaš i 90 procesora, uvek možeš da napišeš program koji formira onoliko procesa koliko imaš jezgara, pa da ubiješ sistem. U svakom slučaju, moraš da imaš interapt koji se okida kada istekne time slice koji je dodeljen procesu, čisto da proveriš da li ima neki drugi proces koji čeka na procesor, pa ako nema, da vratiš kontekst prekinutog procesa. To je bio problem starijih verzija windowsa, jer su interapti mogli da nastupe samo kada proces pozove servis operativnog sistema, pa je moglo lako da se desi da greškom ili namerno uzurpiraš procesor... [ djoka_l @ 23.06.2011. 11:50 ] @
Pravo pitanje za tebe je zašto ti je potrebno da thread ima drugačiji mehanizam zaokruživanja. Threadovi bi morali da se ponašaju na isti način. Možda tvoj koncept nije dobar, možda ti trebaju pravi procesi, u kojima bi važila drugačija pravila.
Na primer: želiš da obrađuješ sliku, pa u zavisnosti od toga koliko imaš jezgara, podeliš sliku na toliko segmenata, pa svaki thread radi sa jednim segmentom slike. U ovom slučaju je jasno da threadovi moraju da računaju na isti način sa FP brojevima. Drugi primer: pišeš program koji radi numeričku integraciju koristeći nekoliko različitih algoritama, pa onda želiš da uporediš rezultate. U tom slučaju je jasno da svaki algoritam može da se izvršava kao poseban proces, a da threadovi nemaju smisla, osim ako ne želiš da svaki pojedini algoritam izvršavaš u više threadova. Tada threadovi jedno algoritma moraju da koriste iste postavke, dok oni koji pripadaju nekom drugom procesu ne moraju. [ Nedeljko @ 23.06.2011. 12:27 ] @
Evo za šta mi trebaju - da napravim intervalnu algebru bezbednu za niti. boost-ova klasa boost::numeric::Interval nije bezbedna za niti, ne vrši sva računanja korektno (acos(-1) zbog baga u intelovim procesorima) i ova moja bi bila brža, ali pravljena za moju specijalnu namenu.
Code: // File: Interval.h #ifndef INTERVAL_H #define INTERVAL_H #include <pthread.h> #include <fenv.h> extern pthread_mutex_t roundingMutex; class Interval { long double lo, up; void lock() { // Zaključavanja su kratka, ali konflikata ima često, pa uspavljivanje niti ne dolazi u obzir. while (pthread_mutex_trylock(&roundingMutex)) { } } void unlock() { pthread_mutex_unlock(&roundingMutex); } public: Interval(long double value = 0) : lo(value), up(value) { } Interval(long double lower, long double upper) : lo(lower), up(upper) { } // ... Interval operator +(Interval i) { lock(); fesetround(FE_DOWNWARD); long double lower = lo + i.lo; fesetround(FE_UPWARD); long double upper = up + i.up; // Sva racunanja bi bila u klasi, tako da restauriranje prethodnog stanja nije bitno. unlock(); return Interval(lower, upper); } // ... }; // ... #endif // File: Interval.cpp #include "Interval.h" pthread_mutex_t roundingMutex = PTHREAD_MUTEX_INITIALIZER; [ djoka_l @ 23.06.2011. 13:09 ] @
Neću da se pravim da razumem o čemu pišeš (intervalna algebra), ali sam pogledao malo dokumentaciju za Boost Interval biblioteku i nešto malo o tome kako se koriste FPU instrukcije.
Ono što mi je privuklo pažnju su add_up i add_down komande koje stižu uz Interval, a to je tačno ono što ti treba. Cela ta muka oko setovanja načina zaokruživanja je u stvari realizovana kroz gomilu _up i _down komnadi. Stvar je u tome što pre FPU operacije treba da se isključi interapt, eventualno snimi kontekst, setuje Control registar, izvrše operacije, vrati kontekst i uključi interapt. Pretpostavljam da je to sve realizovano kroz te metode u asembleru, a ne onako kako ti pokušavaš da uradiš. Nisam siguran da li su metode add_up i add_down thread safe, ali pokušaj da ih isprobaš. [ Nedeljko @ 23.06.2011. 13:52 ] @
Intervalna algebra? Vrlo prosta stvar. Svakoj funkciji se pridružuje funkcija , gde je skup svih zatvorenih intervala tako da za svako važi (ovde se pod podrazumeva tačna vrednost, a ne ono što računar izbaci, dok se pretpostavlja da ima tačnu mašinsku reprezentaciju). Poenta je da posle proizvoljno složenog računa kao rezultat dobiješ interval kome tačan rezultat garantovano pripada (tj. da kontrolišeš grešku računa).
Primera radi, ako brojevi i imaju tačnu reprezentaciju u računaru, onda je gde su i brojevi koji imaju tačnu reprezentaciju u računaru i izabrani tako da je i . Dakle, se računa kao sa FE_DOWNWARD zaokrugljivanjem, a kao sa FE_UPWARD zaokrugljivanjem. boost-ova klasa Interval ima uslovno prevođenje koje zavisi od kompajlera i arhitekture, a na GNU prevodiocima koristi upravo ove funkcije. Pogledaj fajl boost/numeric/interval/detail/c99sub_rounding_control.hpp. Ja sam odatle i saznao za ove funkcije. boost-ova klasa nije bezbedna za niti (što meni treba), ali vrši restauraciju načina zaokrugljivanja na prethodnu vrednost (što meni ne treba). [ vlaiv @ 24.06.2011. 09:32 ] @
Primetio sam da pricas o dve relativno nezavisne stvari i da ti jedna treba a druga ne.
Citat: boost-ova klasa nije bezbedna za niti (što meni treba), ali vrši restauraciju načina zaokrugljivanja na prethodnu vrednost (što meni ne treba). Znaci ako je parce koda bezbedno za niti, to znaci da sa dva razlicita threada ti mozes zvati to parce koda bez bojazni da ce doci do "pucanja" programa. Ali to ne znaci da ne moras voditi racuna o nekim drugim stvarima kao sto je recimo trenutno stanje promenljive. Zato se obicno uzima trenutno stanje globalne promenljive i pravi lokalna kopija za upotrebu u niti. Tvoj slucaj je specifican zato sto je u pitanju registar procesora i ne mozes imati lokalne kopije (mislim mozes imati kopiju vrednosti ali ti ona nista ne znaci kao vrednost, znaci kad je u registru). Znaci kod tipa: flag temp = trenutna_vrednost_flaga; setuj_flag(zeljena_vrednost); radi_operacije_koje_treba(); setuj_flag(temp); Moze sam po sebi biti threadsafe u smislu da nece izazvati neki invalid pointer exception i slicno, odnosno mozes ga bezbedno zvati i program ce se izvrsiti ali ne garantuje da ce ti rezultat biti tacan zato sto u radi_operacije_koje_treba() trenutku moze drugi thread da setuje flag na drugu vrednost. Jedini nacin da se izbegne ova korupcija podataka je sledece: lock(); flag temp = trenutna_vrednost_flaga; setuj_flag(zeljena_vrednost); radi_operacije_koje_treba(); setuj_flag(temp); unlock(); Ali vodi racuna da ce to u slucaju da nisi threadove rasporedio po procesorima da ti samo donese usporenje. Ako se threadovi izvrsavaju na razlicitim procesorima u multiprocesorskoj masini onda ce biti ok sto se performansa tice (nece biti puno hitova na zakljucan kod) i naravno vodi racuna da nemas 20 threadova na 2 procesora :D [ Nedeljko @ 25.06.2011. 07:14 ] @
Digao sam mnogo buke niokočega. Evo šta kaže man pthread_create
Citat: The new thread inherits the calling thread's floating-point environment (fenv(3)). Dakle, svaka nit ima svoje podešavanje s tim da nova nit nasleđuje podešavanje od niti u kojoj je pozvana funkcija pthread_create. Samim tim je i boost-ova intervalna biblioteka bezbedna za niti. Copyright (C) 2001-2024 by www.elitesecurity.org. All rights reserved.
|