Šta je novo?

Oficijelni AMD DualCore Thread

  • Začetnik teme Začetnik teme Nedjo
  • Datum pokretanja Datum pokretanja

Nedjo

Čuven
VIP član
Učlanjen(a)
12.07.2000
Poruke
6,934
Poena
800
http://www.hkepc.com/hwdb/dualcore-opteron-1.htm

Ili Babelfish ili samo gledanje slika 😉

Jos da su za oba (sva cetiri) procesora imali PC3200 umesto PC2100 i 2700 memorije...
Zanimljivo je da su mu smanjili voltazu na 1.35V
Razlika u Business Winstoneu je impresivna! U Sandri je jos "gore", mada kolik oje Sandra merodavna...
Cinjneica da su dva 2.2GHz opterona i dalje sporija od jednog DualCore 2.2 GHz Opterona daje AMD-u za pravo da DC Opteron prodaje po malo visoj ceni u odnosu na SingleCore...
Ono sto je malo zabrinjavajuce jeste skliranje kada se ubaci jos jedan DC procesor. Da li OS ili obicne aplikacije (Sanda svakako ume da izmeri dodatnu procesorsku snagu) ne umeju da iskoriste jos jedan CPU... ne verujem da je problem do samog procesora.
Minus testa je nedostatak serverskih testova, ali plus je ilustracija kako ce se DC Athlon64 ponasati u odnosu na SC.
Sve sam blizi odluci da preskocim Venice i da idem direktno na Toledo!
 
Ovaj test bas i ne govori puno, jer nije bilo 'pravih' multiprocesorskih testova, ko sto Nedjo rece za server, ali ni za ostale primene. Mogli su da puste neki media encoding test za koji je poznato da podrzva multithreading pa bi videli malo bolje situaciju.

Rezultati gde je dual-core opteron bolji od dva single core su verovatno zbog unapredjenog memorijskog kontolera, mozda i zbog brze inter-cache sinhronizacije. Videcemo kad bude i drugih testova, posebno kad se uporedi za dual core Pentium D EE.
 
mcekovic je napisao(la):
Ovaj test bas i ne govori puno, jer nije bilo 'pravih' multiprocesorskih testova, ko sto Nedjo rece za server, ali ni za ostale primene. Mogli su da puste neki media encoding test za koji je poznato da podrzva multithreading pa bi videli malo bolje situaciju.

Rezultati gde je dual-core opteron bolji od dva single core su verovatno zbog unapredjenog memorijskog kontolera, mozda i zbog brze inter-cache sinhronizacije. Videcemo kad bude i drugih testova, posebno kad se uporedi za dual core Pentium D EE.
DualCore Pentium Extreme Edition nije direktna konkurencija DualCore Athlonu64, ako gledamo sa primarnog, cenovnog stanovista.
DualCore Athlon64 ce se prodavati po cenama Pentuma D, dok DC Pentium EE ostaje u (strato)sferi od 1000USD, skuplji cak i od dolazeceg FX57
 
Htedoh reci da ce se dual-core opteron i Pentium D EE prvo pojaviti, a posto ce verovatno i AMD koristiti malte ne isto jezgro za dual-core A64FX i Intel isto jezgro za dual-core Xeon-e, bice interesantno kakav je odnos snaga u server/workstation delu.
 
Poslednja izmena:
mcekovic je napisao(la):
Ovaj test bas i ne govori puno, jer nije bilo 'pravih' multiprocesorskih testova, ko sto Nedjo rece za server, ali ni za ostale primene. Mogli su da puste neki media encoding test za koji je poznato da podrzva multithreading pa bi videli malo bolje situaciju.
Potpuno se slazem sa tobom, sto se toga tice test je malo bez veze, ali ipak DC opteron jos nije ni izasao, a ovde se vec vidi da je DC Opteron nesto brzi od dva Opterona 248.
Rezultati gde je dual-core opteron bolji od dva single core su verovatno zbog unapredjenog memorijskog kontolera, mozda i zbog brze inter-cache sinhronizacije. Videcemo kad bude i drugih testova, posebno kad se uporedi za dual core Pentium D EE.
Verovatno je i zbog toga, Opteron 866 je baziran na E jezgru koje ima i SSE3, kao i jos neke optimizacije. Doduse, tamo gde SMP usporava stvar, DC bi trebalo da ne usporava. 😉 ,zbog svoje "direct connect" arhitekture.
 
Dual Core A64 X2 stizu uskoro!

Bar je tako sudeci po izvestavanju Inquirer-a:

AMD launching dual core Athlons tomorrow:
http://www.theinquirer.net/?article=22676

AMD's dual core kimono falls fully open:
http://www.theinquirer.net/?article=22685

Najslabiji A64 X2 4200+ radice na 2.2GHz i imace 2x512KB L2 cache-a,
a najaci 4800+ radice na 2.4 GHz i imace 2x1MB L2 cache-a i kostace 1001$!

Nesto mi se 'prividja' da ce ovaj poslednji A64 X2 2.4GHz 2x1MB da jede Pentim D EE na 3.2GHz ne samo za dorucak, vec i za uzinu, rucak i veceru. 😀

Ovo mi se 'prividja' sobzirom da odgovarajuci A64 4000 2.4GHz 1MB cache 'dere gace' Prescott-u na 3.8GHz 1MB cache, a kamo li tek onome na 3.2GHz!
 
Zaboravio je Inquirer da pasteuje iz AMD PDF-a da ce najjeftiniji, 4200+, kostati oko 500 usd. Bice dostupni od Juna.
 
Prilicno sam iznenadjen da je AMD odlucio da preskoci 1.8 i 2.0GHz vrednosti! Ajd za 1.8, ali da ide direkt na 2.2 GHz... zaista cudno.
Ovo ostavlja prostora za Sempron DualCore na doticnim frekvencijama, ali sa 256 i 128KB cachea. Naravno u 939 pakovanju i sa ukljucenim 64bitnim ekstenzijama.

Doduse, verovatno su ljudi u AMD-u vrsili testiranja i ispostavilo se da je za dobijanje oznaka preko 4000 neophodna veca hercazza od 1.8 i 2.0 GHz, pa su odmah isli na 2.2 i 2.4.

Meni se X2 naziv dopada. Znaci sledeci CPU iz AMD-a je FX57 (2.8 GHz 1MB L2)
 
Ne znam sta da kazem, ali AMD je ovog puta zaista odradio posao kako treba. Prednost u odnosu na Intel CPU-ove je sada ubedljiva, prakticno na svim poljima. AMD trenutno ima najbolji "gaming CPU", a sada i ubedljivo najbolji "workstation CPU" .
Moje pretpostavke oko prednosti koje ce imati K8 arhitektura u odnosu na Intel, kod Dual Core sistema su bile tacne, pa uopste nisam preterano iznenadjen rezultatima koji su dobijeni u raznim testovima.
Interesantno je da A64 4200+ x2 koji ce da kosta manje od 500$, dobija Pentium 4 840 XE u prakticno svim testovima.
Zanimljiva su govorkanja o tome da AMD DC procesori imaju implementran Hyperthreading !
Takodje je zanimljivo i to da Dual 275 Opteron ima potrosnju nesto manju od jednog Pentiuma D, kao i da Opteron 175 ima nesto manju potrosnju nego 2.6 Ghz Opteron 152.
Sve u svemu, ne secam se kada je AMD imao toliko ubedljivu pobedu.
 
Poslednja izmena:
Evo sad detaljnije citam Anadov tekst/test i tek sad vidim da je on u sustini "simulirao" A64 X2!! Uzeo je Opteron i "naterao ga" da bude X2! Ako se uzme u obzir ploca, memorija i ovo govorkanje oko HyperTreadinga (koji kod Opterona, navodno, nije ukljucen), onda su njegovi navodni rezultati navodnog Athlona 64 X2 4400+ totalno irelevantni i nizi nego sto ce biti oni kod pravog X2 4400.

Ono sto je po meni najvece AMD-ovo dostignuce jeste da su uspeli veci broj tranzistora da smeste na manju povrsinu nego sto je to slucaj sa Inteloim DC procesorima. Dobro, nije velika razlika, ali ipak postoji. Jasno je da DC stihija pocinje tek sa prelaskom na 65nm proizvodnju kada ce se ova jezgra od po 200 kvmm prepoloviti na ciljnih 100 kvmm.

I dalje me kopka nepostojanje 2 GHz X2-ke. Moguce je da AMD pred kraj godine izbaci X2 3800 (2GHz/512x2 kb L2) i X2 4000 (2 GHz/1024x2 kb L2) po cenama tu negde oko 400 USD!?

Pravi sjaj X2-ke cemo videti tek u junu, odnosno julu (u dvobrojevima domacih papirnih publikacija i elektronskih medija) i to na WinXP x64! 😉
 
Kako to da su DualCore Opteroni zavrsili sa 233.2 miliona tranzistora?
Jedan Opteron sa 1MB cache ima 105.9. Ako se dobro secam, pricalo se da dele X-bar, tako da se drugo jezgro jednostavno "prikljuci" na njega. Tako bi DC zavrsio sa nesto manje od duplog broja tranzistora (~205).

Na sta je otislo ~25 miliona tranzistora? HyperTreading?

Rezultati su impresivni.
Posebno je interesantno to sto je pisalo na Tech-Reportu za Win XP X64:

WinXP x64 is NUMA aware—that is, it comprehends the need to put data into the memory attached to the CPU modifying that data. By nature, Opteron systems require a NUMA-aware OS in order to perform at their best. Also, AMD says that the WinXP x64 scheduler is especially well tuned for dual-core processors.
 
The X2 processor will be offered at similarly high price levels with the top model 4800+ breaking the $1000 mark ($1001). The 4600+ will cost $803, the 4400+ $581, and the 4200+ $537. The currently fastest single-core Athlon (4000+) is priced at $643, the high-end FX-55 at $827.

Rezultati u benchmarcima vladaju, ali sam se naježio od cene..
 
DeanXP je napisao(la):
Kako to da su DualCore Opteroni zavrsili sa 233.2 miliona tranzistora?
Jedan Opteron sa 1MB cache ima 105.9. Ako se dobro secam, pricalo se da dele X-bar, tako da se drugo jezgro jednostavno "prikljuci" na njega. Tako bi DC zavrsio sa nesto manje od duplog broja tranzistora (~205).

Na sta je otislo ~25 miliona tranzistora? HyperTreading?

Rezultati su impresivni.
Posebno je interesantno to sto je pisalo na Tech-Reportu za Win XP X64:
Pa moguce, doduse Hyper Threading nije ukljucen, a tu je i system request interface, koji ne postoji u takvoj formi u jednojezgarnom Opteronu. Sve u svemu, impresivan je podatak o 233 milona tranziostora. To je vise i od nVidia 6800GT GPU-a !
 
Koliko shvatam glasine o Hyper Threading-u kod A64 X2, on je samo na nivou jednog bita u procesoru koji software-u (OS-u, itd...) signalizira da procesor ima 2 logicka procesora, kako bi se primenile optimizacije koje su do sada radjene za P4 HT.

Iako je moguce i suprotno, cini mi se da je jako malo verovatno. AMD je u zadnje vreme, bar kada je arhitektura u pitanju, povlacio krajnje pragmaticne poteze, a uvodjenjem HyperThreading-a kod A64 ne bi se puno dobilo, jer je A64 IPC prilicno visok i dodatni thread ne bi imao puno slobodnih resursa da iskoristi (posto se resursi kod HT-a dele), te dobici ne bi bili kao kod P4, koji ima znatno manj IPC (da ne kazem neku ruzniju rec 🙂)
 
mcekovic je napisao(la):
Koliko shvatam glasine o Hyper Threading-u kod A64 X2, on je samo na nivou jednog bita u procesoru koji software-u (OS-u, itd...) signalizira da procesor ima 2 logicka procesora, kako bi se primenile optimizacije koje su do sada radjene za P4 HT.

Iako je moguce i suprotno, cini mi se da je jako malo verovatno. AMD je u zadnje vreme, bar kada je arhitektura u pitanju, povlacio krajnje pragmaticne poteze, a uvodjenjem HyperThreading-a kod A64 ne bi se puno dobilo, jer je A64 IPC prilicno visok i dodatni thread ne bi imao puno slobodnih resursa da iskoristi (posto se resursi kod HT-a dele), te dobici ne bi bili kao kod P4, koji ima znatno manj IPC (da ne kazem neku ruzniju rec 🙂)
Bice da si ti u potpunosti u pravu! U krajnjoj liniji bilo bi krajnje licemerno, u nedostatku bolje reci, da AMD ubaci HT nakon sto je tako glasno propagirao PROTIV te tehnologije.
 
mcekovic je napisao(la):
Iako je moguce i suprotno, cini mi se da je jako malo verovatno. AMD je u zadnje vreme, bar kada je arhitektura u pitanju, povlacio krajnje pragmaticne poteze, a uvodjenjem HyperThreading-a kod A64 ne bi se puno dobilo, jer je A64 IPC prilicno visok i dodatni thread ne bi imao puno slobodnih resursa da iskoristi (posto se resursi kod HT-a dele), te dobici ne bi bili kao kod P4, koji ima znatno manj IPC (da ne kazem neku ruzniju rec 🙂)
Pa arhitektura A64 ima dosta resursa, ne vidim zasto ne bi HT doneo neko dodatno ubrzanje. Ne mislim da je K8 arhitektura "nategnuta" do kraja. Kao prvo, K8 ima 9 izvrsnih jedinica, trostruki superskalarni FPU, sestostruki integer core, dekodira prakticno tri x86 instrukcije u ciklusu. Multithreading uostalom, postoji na RISC procesorima koji imaju veoma dobar IPC, pa prema tome, ne vidim zasto bi HT bio rezervisan samo za Netburst.
 
Nedjo je napisao(la):
Bice da si ti u potpunosti u pravu! U krajnjoj liniji bilo bi krajnje licemerno, u nedostatku bolje reci, da AMD ubaci HT nakon sto je tako glasno propagirao PROTIV te tehnologije.
Pa i Intel je propagirao protiv x86-64 pa su ga uveli. :d
 
drfedja je napisao(la):
Pa arhitektura A64 ima dosta resursa, ne vidim zasto ne bi HT doneo neko dodatno ubrzanje. Ne mislim da je K8 arhitektura "nategnuta" do kraja. Kao prvo, K8 ima 9 izvrsnih jedinica, trostruki superskalarni FPU, sestostruki integer core, dekodira prakticno tri x86 instrukcije u ciklusu. Multithreading uostalom, postoji na RISC procesorima koji imaju veoma dobar IPC, pa prema tome, ne vidim zasto bi HT bio rezervisan samo za Netburst.

Od podrske za HT na K8 procesore nema nista i naravno da je rezervisan samo za NetBurst i to iz vise razloga.

Prvi naravno predstavlja trace cache i logika za predvidjanje grananja. U slucaju da dodje do promasaja, sve instrukcije iz pipeline lete napolje, sto znaci da x86 instrukcije moraju ponovo da se dekoduju. To nije slucaj kod p4, posto su x86 instrukcije vec dekodovane.

I nema veze sto K8 procesori imaju 6 ALU i 3 FPU jedinice. Da bi tih 6 ALU jedinica iskoristio na pravi nacin, moras da ih konstantno punis instrukcijama. K8 u idealnim uslovima dekoduje 3 instrukcije u jednom ciklusu, a P4 ne samo da ih dekoduje, vec su moperacije na raspolaganju u trace cache-u. Mozemo da pricamo i o duzini pipeline-ova u P4 procesorima. Da, linije protocne obrade su uzasno dugacke, ali to ima i svojih prednosti, a ocigledna prednost (u ovom konkretno slucaju, a pricamo o HT) je visi stepen paralelizma koji se postize.

Audiofreak je vec nesto pricao o tome u jednom drugom threadu, ako te ne mrzi pogledaj.
 
Poslednja izmena:
drfedja je napisao(la):
Pa i Intel je propagirao protiv x86-64 pa su ga uveli. :d

tvrdoglavi su oni fedja, ali mnogo. Na kutiji P4 630 procesora nigde ne pise da podrzava EM64T. Ja sam vec mislio da su mi dali pogresan 🙂 Medjutim na poledjini kutije jako sitnim slovima (srecom tu je ostro oko 🙂 ) pise da procesor zahteva plocu sa biosom koji podrzava EM64T 🙂 To je sve, kutija je plavo-narandzasta, kao i kod svih drugih LGA775 procesora (ona malo veca) i na hologramskoj nalpnici ne pise uopste nigde EM64T. Mozda se boje da ce ih AMD tuziti...
 
genijalcin@23 je napisao(la):
Od podrske za HT na K8 procesore nema nista i naravno da je rezervisan samo za NetBurst i to iz vise razloga.

Prvi naravno predstavlja trace cache i logika za predvidjanje grananja. U slucaju da dodje do promasaja, sve instrukcije iz pipeline lete napolje, sto znaci da x86 instrukcije moraju ponovo da se dekoduju. To nije slucaj kod p4, posto su x86 instrukcije vec dekodovane.

I nema veze sto K8 procesori imaju 6 ALU i 3 FPU jedinice. Da bi tih 6 ALU jedinica iskoristio na pravi nacin, moras da ih konstantno punis instrukcijama. K8 u idealnim uslovima dekoduje 3 instrukcije u jednom ciklusu, a P4 ne samo da ih dekoduje, vec su moperacije na raspolaganju u trace cache-u. Mozemo da pricamo i o duzini pipeline-ova u P4 procesorima. Da, linije protocne obrade su uzasno dugacke, ali to ima i svojih prednosti, a ocigledna prednost (u ovom konkretno slucaju, a pricamo o HT) je visi stepen paralelizma koji se postize.

Audiofreak je vec nesto pricao o tome u jednom drugom threadu, ako te ne mrzi pogledaj.
Ma skapirao sam ja kako radi HT na P4 procesorima i to da je Trace Cache sastavni deo NetBursta, ali to nema veze sa resursima koje ima sam procesor, vec sa organizacijom paralelizma. Verovatno da bi trebale vece izmene da se urade na samom K8 jezgru da bi se doslo do Hyperthreadinga.
K8 daleko bolje dekoduje x86 nego K7, iako i jedan i drugi imaju trostruki dekoder. Uostalom, da bi svoje resurse bolje iskoristio K8 ima "look ahead unit" koji omogucuje pripremu za izvrsenje operacija dok se jos izvodi dekodiranje. Pomocu Stack Pointera, ESP registra i Base Pointera EBP, K8 moze da radi vise adresnih kalkulacija istovremeno. Instrukcije poput PUSH, POP, ADD ESP, IMM, mogu da se izvrsavaju paralelno (out of order). Ovaj SPR registar omogucuje da se dodeli sest ovakvih vrednosti odjednom. Prema tome, ne vidim da je standardna "harward cache" arhitektura neka prepreka implementaciji SMT-a.
Veliki misspredict koji ima dugacak pipeline, moze biti anuliran implemetacijom Hypethreading-a, pa je dobitak u odnosu na standardnu NetBurst arhitekturu dosta velik.
Prema tome, pristup K8 arhitekturi po pitanju dekodiranja i izvrsenih ROP-ova, ili kod NetBursta mOp-ova je razlicit.
Sto se tice Hyperthreading-a, t.j. Multithreading-a, on ne postoji samo na Netburst-u, vec ga je IBM implementirao u Power5, Sun u svojim RISC procesorima itd.... http://arstechnica.com/articles/paedia/cpu/POWER5.ars/2
samo sto je on implementiran na drugi nacin.
Interesantno je i to da DC Opteron ima 233 miliona tranzistora, sto je 21 milion vise od dva spojena Opteron jezgra sa sve memorijskim kontrolerima. Ako u to uracunas Scheduler za dva jezgra i onih 5% povrsine jezgra o kojem prica Intel u svojoj implementaciji Hyperthreading-a, navodi na pomisao da je tako nesto moguce.
 
Nazad
Vrh Dno