Šta je novo?

2x Clowerton vs. 2x Barcelona

Nedjo

Čuven
VIP član
Učlanjen(a)
12.07.2000
Poruke
6,934
Poena
800
Posto smo prekardashili sa prethodnim tredom o Barceloni, evo novog treda, sa konkretnim rezultatima!

Clowertoni rade na 2.66 GHz, a Barcelone na 2.6 GHz:

http://multicore.amd.com/us-en/AMD-Multi-Core/Products/Barcelona/Performance.aspx

Jasno je da je Intelov odgovor Xeon na 3 GHz, aliobzirom da je 2.66 GHz deklarisan na 120W, realno je ocekivati da se saceka 45nm verzija. Iz tog razloga ce prvi Penryn procesori biti namenjeni serverskom trzistu!
 
Poslednja izmena:
Ovo opet ne govori mnogo o IPC-u K10 procesora. U pitanju su opet 'rate' testovi.
Sto se serverskih procesora tice, ima logike. Po toj logici perf/watt je na strani Barcelone.

Ova tabela nam pokazuje da je 2.6 Ghz 2xQuad K10 brza oko 2x od 2xdual 2222SE 3.0 Ghz Opterona u SpecINT Rate testovima.
Isto tako je brza oko 80% u SpecFP Rate testovima.
Sta nam ovo govori ?
Pa, verovatno da vecina SpecFP i SpecINT rate testova zahteva dobar rad sa memorijom i brzu mejujezgarnu i medjuprocesorsku komunikaciju. S' obzirom da integer performanse zavise u mnogome od mikroarhitekture, moze se zakljuciti da bi SpecInt Base 2006 za 2.4-2.6 Ghz K10 bio otprilike jednak 3 Ghz K8. To nam opet ne govori mnogo o tome kakav je K10 CPU.
Razlika u SpecFP rate-u je manja nego u Int, sto nam govori o tome da ova baterija testova relativno malo koristi 128-bitne SSE instrukcije. U specificno optimizovanim stvarima razlika bi morala da bude kudikamo veca.
SpecFP rate, sa istim brojem jezgara na K10 daje vrlo slicne rezultate kao na K8. Int rate bi trebalo da daje oko 15-20% vece.
 
Poslednja izmena:
Nedjo, vratili smo se na isto, plus sto ovde i nemamo freq. Barse. Da bajem u bob da li su iste ili Barsa radi na 2G? Necu, dok ne vidim brojke, rade na istim freq.
Opet nije duplo brza od trenutnih Opterona - meni to govori da je process failure. (cak i u FP)
Ako AMD juri samo performance/watt, juri u losem smeru (tu vec ima itekakvu prednost zbog quad/octal socket trzista). Treba da se potrudi za performance. Ovo nije "pure performance" kako kaze start texta.
 
Nedjo, vratili smo se na isto, plus sto ovde i nemamo freq. Barse. Da bajem u bob da li su iste ili Barsa radi na 2G? Necu, dok ne vidim brojke, rade na istim freq.
Pa jesam li lepo napisao frekvencije? I pogledaj sta sitnim slovima pise na slikama!
 
Ako se sve ovo lepo sracuna i skalira po procesoru rate-ovi za dva jezgra bi trebalo da izgledaju otprilike ovako:
2.6 Ghz K10 spec Int Rate ~ 25.5
2.66 Ghz Core 2 Duo spec Int Rate ~ 26.5
3.0 Ghz K8 Spec Int Rate ~ 23

2.6 Ghz K10 Spec FP rate ~ 25
2.66 Ghz Core 2 Duo Spec FP rate ~ 24
3.0 Ghz K8 Spec FP Rate ~ 25

Ove brojeve sam izvukao pod pretpostavkom da sa jednog na dva socketa AMDovi K10 procesori skaliraju oko 1.95x, K8 je poznato da skalira u ovim testovima ok 1.9x, Clowertown skalira oko 1.7x sa 1 na 2 socketa i oko 1.9x sa dva na cetiri jezgra.

Poredjenja radi, K8 @2.6 Ghz ima Int Rate 2006 oko 18.
Kao zakljucak, sta mogu obicni korisnici da ocekuju od K10. Pa, dosta brzi sistem, u FP nesto brzi od C2D, Int. nesto malo sporiji, prvenstveno zbog ogromnog L2 kesa koji poseduju Intelovi procesori. S' obzirom na superioran memorijski podsistem, poboljsanu kesh arhitekturu i jos kojekakve sitnice, K10 bi mogao da bude veoma dobar gaming CPU.

Verovatno da ce se Int base jos malo povecati na Agena CPU-ovima usled korsicenja brze nebaferovane DDR2 memorije. U ekstremnim situacijama, K10 ce verovanto ostavljati iza sebe konkurenciju.
 
Poslednja izmena od urednika:
Hmmm, nesto se ne bih slozio... 2222SE je po ovome brzi od Xeona, ali daleko od toga da je brzi za igranje (znaci to je uporedjivanje X2 6000+ @ 3G i C2D @ 3G).
Da uzmem optimalno skaliranje 1-4 socketa, dobija se da je 27% brzi za Int, 7% brzi za FP rate od K8 clock-for-clock. Gde ga to stavlja u odnosu na C2D iste freq? (ne znam, pitam ozbiljno).

BTW, memorija ce ubrzati Agenu ako je vece freq. Sam ECC/buffered ne usporava rad (sta god sam uporedjivao na svojoj FBDIMM-667 mashini naspram Q6600 sa DDR2-667 rezultati su bili isti). Obican DDR2-800 je doduse doneo primetnu razliku (u korist Q6600), zato i razmatram Q6600 do jeseni ;)
 
Int rate za 3.0 G 2222SE je manji za 2 od Int rate-a za Xeon 2.66 Ghz . Core 2 je brzi od K8 i u igrama koje nisu SSE2 optimizovane, a to je rezultat mikroarhitekturalnih unapredjenja, a uzrok povecanog Int rate-a je bas to. By the way, Core 2 vs K8 na istoj freq , K8 ima oko 50% manji Int rate, sto je inace vise nego sto je u praxi slucaj.

Inace, x87 FP nije mnogo bolji kod Core 2 u odnosu na K8. Ako postoji razlika u x87 i skalarnim SSE operacijama u odnosu na K8, to je prvenstveno zbog mikroarhitekturalnih izmena i unapredjenja. Po jezgru, gledano, single thread, K8 nigde nije bolji od Core 2.

Sad da predjemo na skaliranje po socketima. S' obzirom na to da Core 2, tj. Xeon, je limitiran svojm FSB arhitekturom, povecanje na dva socketa rezultuje. Dakle, Spec Int Rate skalira oko 1.7x na Xeonu na 2 socketa, a na Opteronu sa ccNuma oko 1.9x. Odatle veci Spec rate rezultati za 2222SE.
Ne znam sta podrazumevas pod optimalnim skaliranjem, ali idealno bi bilo sa 2x vise socketa, 2x vise performansi. Sa povecanjem socketa ce sigurno Spec rate biti veci u odnosu na Xeon. Sa jednim socketom ce spec rate biti prilicno slican, razlikovace se u zavisnosti od izbora memorija i chipsetova.

Brza memorija ce svakako doneti ubrzanje. Projektovane performanse K10-tke su predstavljene s' tim da je uzeta u obzir DDR2 667 ECC memorija, prilicno labavih latencija. Agena ce doci sa podrskom za DDR2 1066 DDR2 memaru.
 
Int rate za 3.0 G 2222SE je manji za 2 od Int rate-a za Xeon 2.66 Ghz .
Hmm, ja imam los vid, pa.. zar ovaj AMD char ne pokazuje da je 2222SE brzi i u Int i u FP Rate od Xeona 5160? (5160 je 3GHz, takodje i 2222SE)
Aha - mislis na single socket?
 
Poslednja izmena:
Single socket, naravno! ;) To je ono sto interesuje vecinu ljudi ovde.
 
***, obicno mi ne smeta vrucina, ali nakon 7 dana na planini dobro da sam ista danas shvatio ;-)
 
Ajde pitanje pametnijima, koliko POVRay pokazuje arhitekturni napredak?
 
Pa ako je memorijski podsistem u pitanju, ne pokazuje nikakav napredak. Sasvim je sve jedno da li imas FSB 800 ili 1333, IMC, 512K ili 2MB kesha. Rezultati ce biti isti.
Elem, pravo pitanje je sta on zapravo koristi. Kao sto su napisali ljudi u onom blog-u, program koristi poprilicno instrukciju za konvertovanje iz single precision u double float format, koja na K10 je prebacena u vector path, pa je duzina dekodiranja i izvrsavanja ove instrukcije povecana.

Moze da se lako desi da bas ovaj test pokazuje slabosti K10 uArhitekture. Ipak, s' obzirom na to da je on sastavni deo SpecCPU 2006 baterije testova, koje ne pokazuju tako lose rezultate na K10, trebalo bi da ova uarhitektura bude sasvim ok, t.j. vrlo konkurentna, ako ne i nesto bolja od Core2 na istom taktu.
Ipak, ne ostaje nam nista drugo nego da sacekamo jos mesec dana da se pojave prvi semplovi ovih procesora.
 
A INT/FP Rate?
 
INT/FP rate skaliranje zavisi mnogo od intercore komunikacije.
 
INT/FP rate skaliranje zavisi mnogo od intercore komunikacije.
Da, ali mi nismo videli skaliranje, nego samo rate ;-)

V8 ce biti obican workstation 5000P/V/Z chipset (ne X). Nema nimalo logike u tome, sem cene mozda. (isti procesori, ista memorija, obican chipset).
storm, uporedi POVRay na Clovertown i Opty 2xxx seriji. Posto je AMD uporedio 2xxx seriju sa Barsom dobices komparaciju Clovera i Barse.
Koji POVRay? RA kaze da je deo Spec suite-a, valjda je jedan :D
 
Poslednja izmena od urednika:
Nego, nesto sam juce bas gledao u vezi PovRAY-a i zakljucio da to uopste nije adekvatan test, ako gledamo verziju 3.7 beta. Naime, iste scene su se renderovale sporije sa sve ukljucenim SSE2 i multiprocesiranjem, nego u verziji 3.6 bez toga. Scene u obe varijante imaju isti broj efekata.
Drugim recima, PovRAY 3.7 SSE2 je preko 2x sporiji od PovRay 3.6, i skoro 3x u x87 verziji.
Na K8 je SSE2 verzija PovRAY-a 3.7 brza oko 12% od x87.
Dakle, tu nesto ipak ne valja.
 
OK je POV, na sajtu i pise de sa 3.6 koristi za bench ne 3.7
 
Na demonstraciji Barcelone se koristio 3.7b.
 
Ne sporim uopste da nike tako! :d
 
Ako su PR glupi, kakvi su tek ostali ^^
Salu po stranu, niko nije glup da ne pita upucene ljude (citaj: razvojni tim) sta da koristi na demou.
Onda su znaci AMD-ovi PR ljudi glupi do bola kad su koristili pogresan test. :d
 
Otkud ti znas koga je Randy pitao za test ? Cisto sumnjam da on ulazi u detaljnu analizu sta da se pusti. Inace, kao sto rekoh, mislim da je vrlo glupo pustati beta program na beta procesoru. To sigurno ne moze da da pravu sliku o performansama.

Sto se tice AMD-a, verovatno je da nisu ni hteli da prikazu sta zaista moze taj CPU, naglasak oko cele price je bio na 2x boljim performansama sa isto W. Moje misljenje je da su hteli da kazu kako, eto, nije isto staviti cetiri jezgra na isto parce silicijuma i staviti 2x2 jezgra u MCM modul i kako, eto sada imamo cetiri jezgra u istom serveru, sa istom potrosnjom kao i pre sa dva.
Cinjenica je da bi te performanse morale da budu >2x, ali nisu zbog ko zna kojih razloga.
 
Poslednja izmena:
PR nije pitao upucene? Nije to srpska firma ;-) (Ako cemo tako, onda sumnjam da PR i zna sta je POVRay :D)
 
Randy Allen tesko da je PR... To je covek koji je bio chief engineer za K9 (rev E) Opteron i bio je odgovoran za projekat...

Chips based on the K9 architecture will likely be released--at least in sample quantities--by the second half of 2005, Weber said. AMD engineer Randy Allen is overseeing the project.
 
Znaci jos gore ;-)

A kako da procenim kada upucen covek izabere los test? Kao Sunce u Juznoj Africi?:)
Pa ***, kompanija koja ume neverovatno bolje da "upakuje" procesore od Intela da napravi PR anti-stunt? Ti mene zezas? Nije to Srbija.
 
Poslednja izmena od urednika:
Nazad
Vrh Dno