Šta je novo?

Puce SGI!

Madtexelu ti si otisao u kukuruz! 😉 Ovde se prica o smrti SGI-a, a ne MIPS-a! MIPS i dalje zzivi i sasvim lepo se licencira! I ne ne pricam napamet kada kazem da je SGI poceo da umire onog momenta kada su se odlucili da svoju buducnost planiraju na Itaniumu!
 
pa lepo nedjo sto ne pricas napamet ali mogao bi i da obrazlozis to sto pricas. ugledaj se lepo na madtexela 🙂
 
Nedjo je napisao(la):
Madtexelu ti si otisao u kukuruz! 😉 Ovde se prica o smrti SGI-a, a ne MIPS-a! MIPS i dalje zzivi i sasvim lepo se licencira! I ne ne pricam napamet kada kazem da je SGI poceo da umire onog momenta kada su se odlucili da svoju buducnost planiraju na Itaniumu!

Grešiš ovaj grešiši silno sine. 😀 MIPS kao arhitektura u raznim varijantama naravno da nastavlja da živi, ali MIPS procesori koji su pucali na high end tipa R8000 se više nikad neće desiti. A to što postoji tamo neki SOC sa MIPS32 setom instrukcija, što se tiče SGIa i MIPS mašina pod IRIXom je isto kao da ne postoji.

Jel si nekad programirao neki MIPS?
 
genuine je napisao(la):
challange je imao Powerpath-2 bus 256bit i 40bit adrese.. ( a ja sam mislio da u interkonekcionu mrezu spada i bus topologija ali ocigledno sam pogresio.. hvala na popravci .. znaci li to da se pod interkonekcionom mrezom smatra samo povezivanje nodova..?)

obicno je interkonekciona mreza 2d mesh , hypercube 3d torus(cray) i sl...

centralizovana deljena memorija obicno koristi bus topologiju sa snoopying protokolom ( implementiranim u kes kontroler ) a distribuirana shared memory orgranizacija najcesce neku vrstu directory protokola(sa distribuiranim direktorijumima)...

p.s.
taj ispit tek treba da polazem i ako lupim nesto nemoj odma da me napadas vec mi objasni... jer za to ovo i sluzi ovaj forum

Interkonekcija je, generalno govoreći, nešto što povezuje neke delove, koji su obično nodovi (cpu, keš i lokalna memorija) mada to ne mora uvek da bude baš tako. Kod Challengea postoji samo jedna magistrala i za nju konkurišu svi procesori, što uglavnom ograničava skalabilnost, a da bi se to ublažilo stavlja se veći L2 keš sa većom asocijativnošću (zato DC procesori u startu imaju 2x1MB keša). Takođe, odavde sledi da je vreme svih procesora memoriji isto. Kod DSM sistema tipa Origin vreme se može drastično razlikovati: vreme pristupa lokalnoj memoriji vs zbir vremena kroz ASICe, samu interkonekciju (svetlost baš nije brza), opet ASICe na drugom kraju i vreme pristupa udaljenoj memoriji kao memoriji.

Torus i meš u 2D ili 3D su vrlo ekonomični, ali se ne skaliraju jako dobro (bisection bandwith po procesoru), a hiperkocka je najbolja po tom pitanju, ali zahteva najkompleksniju logiku. Origini su definitivno bili najskalabilniji DSM, a Altixi 3000 imaju istu interkonekciju kao i Origin 3000. Origini 350 su isto vrlo kompaktni i dosta skalabilni, otprilike, gde je SGIu početak ozbiljnih multiprocesora drugima je tu maksimum.

Inače, ako je neko pročitao saopštenje na SGIevom sajtu, izgleda da nisu skroz bankrotirali, ali da bi se izvukli stvarno ovaj kratki pozitivan kurs koji su imali moraće da se nastavi na duže staze.

Oštar ton..***..kao što rekoh, suviše ljudi priča razne priče, bez ijednog jedinog argumenta i bez ikakvog iskustva sa takvim sistemima. Ali dobro, to je cena demokratije na forumima
 
Donekle se slazem, ali ne vidim zasto bi neko morao da koristi i programira SGI masine da bi znao gde su zabrljali u trzisnom smislu...
 
MadTexel je napisao(la):
Jel si nekad programirao neki MIPS?
Ne! Ali to sto ti jesi ne znaci da ja ne znam o cemu pricam. MIPS je zziv, a sad u kojoj formi i implementaciji je druga tema. Ovde je ipak rec o nestanku i razlozima nestanka SGI-a. Osnovni razlog je svakako pogubljenost menadzmenta i njihov niz losih poteza, pod koje se moze svrstati i vezivanje sudbine kompanije za itanic 😉
 
Ja iskreno nadam da ce SGI da se izvuce.... videcemo....

p.s. samo nesto me zanima... ukoliko intel i ostali planiraju 4 i 8 jezgara po cipu i ako su oni svi nakaceni na istu magistralu koliko ce ta magistrala da bude pod stresom? Razumem da ce oni da ubace puno kesa po jezgru ali to ne resava preterano ucestanost coherence misseva kod visenitnih aplikacija ( ozbiljnih ) .. svakako smanjuje capacity miseve ali ove druge?

mogla bi da se napravi tema na forumu za ovakve price
 
Poslednja izmena:
Ne bi bio prvi put da vidimo da losija arhitektura pobedjuje, verovatno je da ce takav slucaj biti i sa kalemljenjem vise procesora na istu magistralu. Ako je raja zadovoljna, sto praviti problem oko sada tu nekog minornog problema gusenja magistrale 🙁

p.s. pa pokreni temu 🙂 ionako mi je muka od 'kako da overklokujem peglu' i slicnih tema 😀
 
Poslednja izmena:
genuine je napisao(la):
Ja iskreno nadam da ce SGI da se izvuce.... videcemo....

p.s. samo nesto me zanima... ukoliko intel i ostali planiraju 4 i 8 jezgara po cipu i ako su oni svi nakaceni na istu magistralu koliko ce ta magistrala da bude pod stresom? Razumem da ce oni da ubace puno kesa po jezgru ali to ne resava preterano ucestanost coherence misseva kod visenitnih aplikacija ( ozbiljnih ) .. svakako smanjuje capacity miseve ali ove druge?

mogla bi da se napravi tema na forumu za ovakve price

Čim pustiš neko računanje koje ne staje u keš magistrala je maksimalno opterećena. Zato u HPC klastere niko ni ne stavlja 2 procesora, jer bi onda jedan uvek čekao i ništa te ni radio, ali zato košta pa što plaćati neradnika. Keša će da bude sve više i više, možda i na x86 krenu sa L3 kešom, moguće i na ploči. Čak i sa dosta manjim taktom veliki L3 keš bi u takvim situacijama dosta poboljšao stvar. Ako bi trebao da opslužuje 4-8 procesora onda bi morao da ima veliku asocijativnost (min 8), a to ne ide zajedno sa visokim taktom. Sa druge strane, tu ima i rešenja koje skoro za džabe (do određene granice naravno), recimo povećanje bloka koje dosta prija glavnoj memoriji.

Sve to ima efekta tamo gde postoji kakav takav stepen lokalnosti, otprilike dok značajan deo podata koji se obrađuju staje u keš (koliki je tačno % zavisi od aplikacije). Tamo gde toga nema (FFT je divan primer) čim se izađe iz keša brzina katastrofalno pada. To znači da bi neki quad core procesor sa 4x4MB keša 4 FFTa od po 2MB vrteo stravičnom brzinom, dok da mu se daju 4 od 8MB to išlo drastično sporije.

Svakako bi mogao da se uradi tekst o tome, sa malo ozbiljnijom analizom, ovo što sam ovde napisao je samo par osnovnih činjenica. Još bolje bi bilo ako bi bio potkrepljen testovima gde "isti" procesori sa različitom količinom keša rade razne poslove sa različitim stepenom paralelizma. Od mogućih poslića, na pamet mi padaju LU i QR dekompozicija, FFT u 1/2/3D, neki iterativni solver (recimo GS, SOR i možda neki nestacionarni). To su sve poslovi koji drastično opterećuju keš, magistralu i memoriju. Jedina mana toga je što tu ima dosta posla, rezultati se moraju pažljivo čuvati i bila bi ogromna količina podataka tj. tabela i grafikona. Ostaje samo pitanje koliko bi to ljudi zaista pogledalo i koliko bi im to bilo zanimljivo za čitanje jer je u pitanju dosta složenija priča od gledanja bodova u sandri iz koje je sve odmah jasno (ko ima više, taj je brži i tačka). Pa ako ima zainteresovanih...

Ali to sto ti jesi ne znaci da ja ne znam o cemu pricam. MIPS je zziv, a sad u kojoj formi i implementaciji je druga tema.

Kao high performance arhitektura MIPS je mrtav. To što će ga biti u prenosnim uređajima, bez fp aritmetike, za mene je isto kao da ga nema.

Ali to sto ti jesi ne znaci da ja ne znam o cemu pricam. MIPS je zziv, a sad u kojoj formi i implementaciji je druga tema.
Baš tako. To donekle ima smisla. E sad, to što je MIPS nudio 3-4 puta više MFLOPS/W od Intela i imao slabije performanse...bolje da su pustili da ima "samo" 2 puta bolji taj odnos i dosta veće performanse. Ipak, ovo sada može samo da bude šbbkbb. Ili da dođe neki novi CEO i povampiri R18000 što je u domenu fantastike. Nabiti 32 procesora od kojih svaki troši po 100W u rek sa vazdušnim hlađenjem, a da to hlađenje nije turbina je malo nemoguće. Mesta gde se instaliraju takve mašine imaju vrlo ozbiljnu klimatizaciju.
 
Pa povecanje samog bloka kes linije znacajno smanjuje mis rate za sve vrste miseva ali povecava broj bajtova po data referenci drasticno za kernel a onda redom i za aplikacije fft,lu i sl. sto se direktno odnosi na bus..

ajde napravicu temu Multiprocesorski problemi
 
Nazad
Vrh Dno