Barcelona - konkretne brojke

Nedjo · 14.02.2007

AMD je na ISSCC-u izneo neke konkretne brojke vezane za Barcelonu, pa eto prilike da se opet vratimo ovoj temi:

65nm Low-K SOI
11 copper interconnect layers
463 miliona tranzistora
283 mm2 die size
In a 95W max power envelope, the target frequency is 2.2 to 2.8GHz at 1.15V
Each core contains separate 64 KByte two-way set associative caches for instruction and data
512 KBytes of L2 cache
core-shared 2 MByte L3 cache
128-bit per-core FPU
HyperTransport 3.0 links and DDR3 memory support within the integrated Northbridge core

Bogda · 14.02.2007

283mm^2 die size - pa to cudo se po velicini priblizava Itanium 2 procesorima

. Nadam se da ce cene biti ipak povoljnije. Znaci da ce desktop verzija - Agena biti takodje paprena.

Nedjo · 14.02.2007

Objektivno, 283 mm^2 je impresivno dostignuce, obzirom da je rec o quad core procesoru.
pa Brisbane sa 512 KB L2 ima 126 mm^2. Rev. H je prosiren na novou samog jezgra, a tu je i L3 cache.
U ostalom 2 C2D jezgra koja cine Kentsfield imaju povrsinu od 2x 143 mm^2, a Intel poslovicno gusce "pakuje" cache. Sve u svemu ja sam prijatno iznenadjen sto povrsina nije preko 300mm^2.

eatmyshorts · 14.02.2007

Ovako na prvi pogled zvuci impresivno, daj boze da bude tako i u testovima. Meni narocito dobro zvuci ovo 2.8GHz na 1.15 V

Bogda · 14.02.2007

Niko ne spori impresivnost samog chipa. Ostaje samo da se vidi koliko ce biti ekonomski isplativ. Nakon ovih podataka postaje jasno zasto Intel ne planira proizvodju pravog quad core procesora pre prelaska na 45nm.

DeanXP · 15.02.2007

Nema bas previse novih informacija. Valjda ce David Kanter sa RWT nesto vise da sazna kad poprica sa samim inzinjerima. Ima ovde jos malo. L3 kes radi na 75% frekvencije, kao i northbridge.

Interesantno je da Barcelona koristi 11 metalnih slojeva naspram 9 kod K8 i 8 slojeva kod Conroe-a. Veliki nivo on-chip integracije ih kosta tu, a verovatno je i razlog zasto jezgro nije moglo biti manje. Mada nije ni ovako lose obzirom na kolicinu zica koje su morali sprovesti: crossbar sa 4 jezgra, 4 jezgra sa L3, svako jezgro sa svojim L1/L2 na udvostrucenoj magistrali, usitnjena kontrola klokova, PLL za svako jezgro i NB.

Jedino bi im bilo pametno da predju na Intelov nacin racunanja TDP-a. Sa tako agresivnim power management-om Barcelona ce u proseku dosta sacuvati. Mada, ni bez ikakvog power management-a nijedan procesor ne bi mogao dostici maksimalnu potrosnju (napon puta struja) kako AMD racuna TDP.

Bogda je napisao(la):
Niko ne spori impresivnost samog chipa. Ostaje samo da se vidi koliko ce biti ekonomski isplativ. Nakon ovih podataka postaje jasno zasto Intel ne planira proizvodju pravog quad core procesora pre prelaska na 45nm.

Ne bih rekao da se Intel previse brine za povrsinu quad-core-a. 280mm^2 bi palo bez ikakvih problema, pogotovo za high-end chip. Nije Intel nikad bezao od vece povrsine procesora. Cak i ako se zaobidje Itanium kao non-x86 chip (povrsina od 600mm^2), tu je Tulsa sa svojih 435mm^2. Imaju vise nego sposoban proizvodni proces.
U konkretnom slucaju, ne mora ni znaciti da ih dual-dual-core quad kosta mnogo manje od single-chip quad-a. MCM pakovanje je kompleksnije od single chip, pa tu imaju dodatne troskove, kao i kod dodatne validacije chipsetova koji moraju biti spremni da podnesu dva opterecenja na FSB-u.
Verovatniji razlog Intelove odluke je tajming i troskovi RnD-a. Conroe je morao izaci u sto kracem roku pa im nije bilo u interesu dizajnirati ga sa quad-core na umu, a posle izlaska ne vredi trositi pare da se od njega napravi native quad. Za to bi ili morali dodati neki crossbar ili prepraviti L2 cache da se deli preko 4 jezgra sto opet zahteva prepravku celog kes mehanizma. A obzirom da ce Nehalem vrlo brzo stici takvi zahvati se nikako ne bi isplatili.

drfedja · 16.02.2007

eatmyshorts je napisao(la):
Ovako na prvi pogled zvuci impresivno, daj boze da bude tako i u testovima. Meni narocito dobro zvuci ovo 2.8GHz na 1.15 V

Po meni ovo obecava extreman overklok. :d

Zanimljivo je kako ce raditi nova floating point jedinica. Ocekujem bar 40% bolje rezultate nego na K8 sa skalarnim operacijama i do 80% sa vektorskim. Zbog 32-byte fetch-a bi i legacy kod mogao primetno brze da se izvrsava.
Ovaj CPU ce zahtevati brzu memoriju i dobar bandwidth.

eatmyshorts · 16.02.2007

drfedja je napisao(la):
Po meni ovo obecava extreman overklok. :d

Pa i meni se tako cini zato i kazem

drfedja · 19.02.2007

DeanXP je napisao(la):
Ne bih rekao da se Intel previse brine za povrsinu quad-core-a. 280mm^2 bi palo bez ikakvih problema, pogotovo za high-end chip. Nije Intel nikad bezao od vece povrsine procesora. Cak i ako se zaobidje Itanium kao non-x86 chip (povrsina od 600mm^2), tu je Tulsa sa svojih 435mm^2. Imaju vise nego sposoban proizvodni proces.

Pa brine se sigurno. Itanium nije chip koji se prodaje na kilo, pa da brinu o povrsini jezgra. Kada je u pitanju low end procesor, povrsina jezgra je itekako bitna, jer je tu zarada na doticnom silicijumu minimalna, ali je promet ogroman. 1mm^2 veci chip znaci gubitak od ko zna koliko miliona dolara mesecno. Malo li je? :smoke:

ivanbo2003 · 19.02.2007

Pretty Pictures & Numbers by Hans de Vries

http://www.chip-architect.com/news/2007_02_19_Various_Images.html

Hans je napravio lep pregled AMD i Intel jezgara i to sve sa slicicama i brojkama

Barcelona(K10) ima i core overview diagram.

drfedja · 20.02.2007

Hans je stvarno faca. Svaka mu cast.

Jedino sto jos cekamo, su te "konkretne brojke" za Barcelonu. :d
Na kraju, svi smo se osusili od cekanja, a gomila priucenih intel g33kova daju prognoze o performansama K10 jezgra i nenadmasnosti Intelove Core 2 arhitekture.

Bogda · 20.02.2007

Sada kada imamo ove slike, grupica odabranih iskusnih dizajnera mikroprocesora nam moze najaviti perfomanse buduce AMD arhitekture. Ostali koji nisu na njihovom nivou neka sacekaju dolazak nove arhiitekture kako se gorepomenuti ne bi smarali.

Nedjo · 20.02.2007

Za sada ovo su najpouzdanija predvidjanja na Netu:

http://www.xtremesystems.org/forums/showpost.php?p=2013744&postcount=37

http://www.xtremesystems.org/forums/showpost.php?p=2023017&postcount=41

drfedja · 20.02.2007

Usput, malo ot. neverovatno je sta je AMD izvukao iz 90nm procesa. 6000+ bez problema izvlaci 3.4 Ghz na vazdusnom hladjenju. To znaci da zaista moze da se izvuce jos, narocito kasnije u zrelijem 65nm procesu.

Ser_Zile · 20.02.2007

odakle sad to da je dual core K9, a ovo K10? :trust:

ivanbo2003 · 20.02.2007

Ser_Zile je napisao(la):
odakle sad to da je dual core K9, a ovo K10? :trust:

Pa relativno od skoro :d.
Salu na stranu K9(originalni) je otkazan koliko se zna iz nekih glasina,isto kao i originalni K8 Hammer dizajn i zamenjen K8icom koju danas imamo.
K9 je postao dual core K8(logicno),dok je K10 ono sto mi zovemo K8L.
Po AMDu oni nikad nisu imali kodno ima K8L za Barcelonu,vec je to intelov interni code name za K10.Mada verovatno je i intel znao na cemu radi AMD,tj. da K10 nije samo manji update jezgra pa mi nije jasno zasto i otkud K8L oznaka...
K10 je skoro pa novo jezgro sa velikim poboljsanjima(po recima celnih ljudi,oko 90% jezgra je promenjeno).Mozda i vece od K7->K8 evolucije.

OT Po meni ,Nehalem je ono sto je Core2 trebao da bude od pocetka ali zbog vremena kojeg su imali sve manje resili su da izbace Conroe ovakav kakav je danas(a dobar je

).
Nehalem=Penryn + HT+ IMC+CSI + poboljsani intstruction fetch&predecoding+ko zna sta jos

drfedja · 21.02.2007

Meni se cini da Nehalem uarhitektura nece biti ni slicna Core2, pre bih rekao Net Burst like, ili pak neka mesavina P6 i Netbursta + IMC.

K10 je po mikroarhitekturalnim izmenama veci skok unapred nego sto je to K8 u odnosu na K7. Ono kljucno sto razlikuje K8 u odnosu na K7 jeste 12-stepeni pipeline i 2x64-bit load. K10 ce imati 2x128-bit, a za pipeline jos nije niko govorio nista.
S' druge strane Power6 ima 13 stepeni pipeline pa moze da sljaka i na 6 Ghz.

Bogda · 21.02.2007

Sto se radnog imena nove arhitekture tice, secam se pre nekih godinu dana objavljeno da je K10 otkazan i da se AMD koncentrise na K8L. Da li je to bilo zvanicno ili od pouzdanih izvora Inquirera nisam siguran (izgleda ovo drugo).
K8L stvarno zvuci dosta skromno za novu arhitekturu koja treba da vrati AMD u trku sa Intelom.

ivanbo2003 · 21.02.2007

Bogda je napisao(la):
Sto se radnog imena nove arhitekture tice, secam se pre nekih godinu dana objavljeno da je K10 otkazan i da se AMD koncentrise na K8L. Da li je to bilo zvanicno ili od pouzdanih izvora Inquirera nisam siguran (izgleda ovo drugo).
K8L stvarno zvuci dosta skromno za novu arhitekturu koja treba da vrati AMD u trku sa Intelom.

Kao sto smo rekli,K8L ime se nikad u AMDu nije upotrbljavalo za ono sto zovemo K10 ili Barcelona.

DeanXP · 23.02.2007

drfedja je napisao(la):
Pa brine se sigurno. Itanium nije chip koji se prodaje na kilo, pa da brinu o povrsini jezgra. Kada je u pitanju low end procesor, povrsina jezgra je itekako bitna, jer je tu zarada na doticnom silicijumu minimalna, ali je promet ogroman. 1mm^2 veci chip znaci gubitak od ko zna koliko miliona dolara mesecno. Malo li je? :smoke:

U vecini slucajeva to stoji. Ali C2Quad izdvajaju dve stvari: to je high end chip i (vaznije) MCM. Treba voditi racuna na obe strane Murove krive - troskovi pakovanja naspram troskova proizvodnje (na waferu).

drfedja je napisao(la):
Meni se cini da Nehalem uarhitektura nece biti ni slicna Core2, pre bih rekao Net Burst like, ili pak neka mesavina P6 i Netbursta + IMC.

Kako mislis Netburst-like? Pipeline dubok ~30 (NW) ili ~40 (Prescott) faza tesko da ce imati. Ako mislis na neke podsisteme, to sigurno hoce. SMT je vec potvrdjen, mada verovatno dosta izmenjen. Mozda i neki unapredjeni trace cache podsistem.

drfedja je napisao(la):
Ono kljucno sto razlikuje K8 u odnosu na K7 jeste 12-stepeni pipeline i 2x64-bit load. K10 ce imati 2x128-bit, a za pipeline jos nije niko govorio nista.

I K7 je imao 2x64-bit load.
Kljucna unapredjena su bila redizajniran fetch-decode blok (direktan uzrok dodatih faza pipe-a), 2x64-bit L1 <=> L2 bus, IMC i generalan refresh (svi delovi jezgra su manje ili vise tweak-ovani).
K10 donosi znacajna unapredjenja u svim kljucnim delovima procesora (fetch-decode, integer, fp, load/store) kao i redizajniram IMC.
Opsti utisak je da K8->K10 donosi vise nego K7->K8.

Bogda je napisao(la):
Sto se radnog imena nove arhitekture tice, secam se pre nekih godinu dana objavljeno da je K10 otkazan i da se AMD koncentrise na K8L. Da li je to bilo zvanicno ili od pouzdanih izvora Inquirera nisam siguran (izgleda ovo drugo).
K8L stvarno zvuci dosta skromno za novu arhitekturu koja treba da vrati AMD u trku sa Intelom.

Otkazano je sve redom: originalni K8, K9, K10. E sad, ono sto treba razumeti jeste da ova kodna imena nemaju nikakve veze sa prirodnim napretkom tj. nije K10 > K9 > K8. Po glasinama (dosta pouzdanim, posto ih potvrdjuju serije patenata) ove tri mikroarhitekture su se radikalno razlikovale. Originalni K8 je trebalo da bude dual(multi)-core kod koga su (mini)jezgra delila isti dekoder. K9 je Alpha EV8-like 8-issue cudoviste (verovatno sa SMT). A K10 Netburst-like (?) projektovan za visoke frekvencije.
To su tri razlicita pravca sa kojima je AMD interno eksperimentisao, ali na kraju ostao na staroj dobroj K7 mikroarhitekturi. Vrlo slicno situacija je sa Intel-om. P4 je udario u zid, pa su se sad vratili dobroj staroj P6 mikroarhitekturi.
Mikroarhitektura ne mora biti nova i drugacija, samo zato da bi bila nova i drugacija. To nije garancija da je bolja. P6 i K7 imaju mnoge dizajerske pogotke i samim tim dosta potencijala kao polazne tacke za dalji razvoj.

drfedja · 23.02.2007

DeanXP je napisao(la):
I K7 je imao 2x64-bit load.

Mislio sam na L1->L2 trasfer, koji je kod K7 unidirekcion, sirine 64-bita, za razliku od K8.

DeanXP je napisao(la):
Kljucna unapredjena su bila redizajniran fetch-decode blok (direktan uzrok dodatih faza pipe-a), 2x64-bit L1 <=> L2 bus, IMC i generalan refresh (svi delovi jezgra su manje ili vise tweak-ovani).
K10 donosi znacajna unapredjenja u svim kljucnim delovima procesora (fetch-decode, integer, fp, load/store) kao i redizajniram IMC.
Opsti utisak je da K8->K10 donosi vise nego K7->K8.

Dva dodatna pipeline stanja su po meni kljucni core tweak, koji donosi nesto bolji IPC broj i mogucnost nesto visih taktova. Integracija IMC-a je ipak ono glavno sto obelezava K8 mikroarhitekturu. Daleko vise nego reorganizacija CPU jezgra. Moglo bi se reci da je K8, zapravo "facelift" K7, sa promenjenom platformom - IMC-om.

DeanXP je napisao(la):
Otkazano je sve redom: originalni K8, K9, K10. E sad, ono sto treba razumeti jeste da ova kodna imena nemaju nikakve veze sa prirodnim napretkom tj. nije K10 > K9 > K8. Po glasinama (dosta pouzdanim, posto ih potvrdjuju serije patenata) ove tri mikroarhitekture su se radikalno razlikovale. Originalni K8 je trebalo da bude dual(multi)-core kod koga su (mini)jezgra delila isti dekoder. K9 je Alpha EV8-like 8-issue cudoviste (verovatno sa SMT). A K10 Netburst-like (?) projektovan za visoke frekvencije.
To su tri razlicita pravca sa kojima je AMD interno eksperimentisao, ali na kraju ostao na staroj dobroj K7 mikroarhitekturi. Vrlo slicno situacija je sa Intel-om. P4 je udario u zid, pa su se sad vratili dobroj staroj P6 mikroarhitekturi.

Pitanje je kolike su tehnicke mogucnosti izvodjenja takvih mikroarhitektura i njihova komercijalna primena. Vrlo verovatno da bi u nekim specificno napisanim aplikacijama 8-issue chudoviste radilo fantasticno, ali u sirokom spektru drugih, ne bi.

DeanXP je napisao(la):
Mikroarhitektura ne mora biti nova i drugacija, samo zato da bi bila nova i drugacija. To nije garancija da je bolja. P6 i K7 imaju mnoge dizajerske pogotke i samim tim dosta potencijala kao polazne tacke za dalji razvoj.

Slazem se sa ovim, a verovatno i vodeci ljudi u AMD-u, koji smatraju da je K7/K8 odlicna polazna tacka za dalji razvoj, naravno, pod trenutnim okolnostima.

Bogda · 28.02.2007

Evo jos malo konkretnih brojki o Barceloni, prvenstveno o terminima: http://www.crn.com.au/story.aspx?CIID=73837&CIPseq=2

A evo i interesnatnog dela:
"
CRN: When will Barcelona ship?

RICHARD: It's slated for introduction at the end of the second quarter and will be in the market in the third quarter.
":zgran: :zgran: :zgran:

Znaci K8L je daleko od stancovanja u Dresdenu, dace Bog da stancovanje krene tamo negde u junu.
Potvrda da second quarter u AMD-u pocinje 25 juna a ne 1 aprila kao sto neki tvrde!

drfedja · 28.02.2007

Evo i malo konkretnijih brojki, (ako je to stvarno K10 CPU) od pukog nagadjanja kad ce izaci :

http://www.boincstats.com/stats/host_cpu_stats.php?pr=sah&st=0&or=10

Po procesoru razlika je poprilicna u odnosu na sve do sada. Sta cemo sad ?

P.S. Ipak, Seti@home nisu totalno validne brojke, ali ovo se donekle poklapa sa obecanjima koje je AMD dao po pitanju Floating Point performansi.

Bogda · 28.02.2007

Lepa pozicija, i verovatno se odnosi na K10 mada nisam siguran koliko je test relevantan. FX-70 je poprilicno visoko plasiran sto govori da test nije bas "real life" test, vise nekako "alien life".
Mora da je u pitanju cist FPU bez raznih SSE2, 3 ubrzanja.

ivanbo2003 · 01.03.2007

Evo jos konretnije brojke:42% FPU lead and double integer leadover X5355

http://www.eetimes.com/news/latest/showArticle.jhtml?articleID=197700269

SAN FRANCISCO, Calif. — Advanced Micro Devices upcoming Barcelona processor will sport floating-point performance 42 percent higher than Intel's current top-of-the line CPU, the Xeon X5355 also known as Clovertown.

The news marked the first performance numbers AMD has provided for the chip that packs four Opteron cores on a single die and will be in production this fall. AMD also demonstrated working versions of its next-generation graphics chip the R600 to be released by the end of June.

AMD has been under pressure from archrivals Intel and Nvidia. Intel is shipping multiple quad-core processors using a system-in"package approach, claiming it has retaken the performance lead in x86 CPUs. Nvidia shipped a new generation graphics controller last fall, a move the graphics division of AMD has not yet answered.

Mario Rivas, general manager of AMD's microprocessor group, said Barcelona will provide a double-digit leap in integer performance over the quad-core Xeon, though he declined to be more specific. Henri Richard, chief of sales and marketing at AMD, said Barcelona will have a significant integer performance lead over Intel's quad-core chips.

Although the floating point advantage is significant, few applications outside high performance computing and video encoding make use of it. Nevertheless, analysts were positive on the news.

"I thought Richard's comments were a strong vote of confidence in the product," said Nathan Brookwood, principal of market watcher Insight64 (Saratoga, Calif.).

"Virtualized Web servers don't use floating-point processing, but if AMD is seeing integer performance gains over Intel in double digits, that's a positive for them," said Dean McCarron, principal of Mercury Research (Cave Creek, Ariz.), referring to the most mainstream application for Barcelona.

Separately, AMD gave one of the first public demos of the R600, its next-generation graphics controller that uses 320 multiply-accumulate units. The company showed a Barcelona-based system using two 200W R600 graphics cards to hit aterabit/second benchmark.

Release of the R600 has been delayed "a few weeks" so that AMD can roll out a full suite of graphics chips covering multiple market segments for the latest Microsoft DirectX 10 applications programming interface. Rival Nvidia rolled out its high-end DX10 graphics controller, the GeForce 8800 last fall but has not filled out its product line with midrange and low-end parts based on it yet.

"As soon as AMD makes their DX10 announcements, I am sure we will hear about competing products from Nvidia," said McCarron.

In addition, AMD announced a new desktop chip set, the first from the ATI division since the merger last fall. The AMD 690 sports an ATI Radeon X1250 graphics core and a new video decode block. It is also the former ATI's first chip set to support the HDMI video interface with HDCP copy protection for high definition video.

Ten motherboard makers said they will ship as many as 30 products with the chip.

"They put a lot of emphasis on home entertainment with this chip set," said McCarron. "It's a stronger graphics core than they have used in the past," he added

Znaci 42% u FPU i double digit u integer aplikacijama bolja od top quad core intel X5355.Uhhh,nije ni cudo sto intel zuri sa 45nm shrinkom,trebace im ~3.2GHz QC za int i ~3.7Ghz model za FPU aplikacije da bi bila jednaki 2.6Ghz Barceloni

.Gadno

Bogda · 01.03.2007

Double digit znaci 10-ak % brze od trenutno najbrzeg Xeona X5355 (na 2.66GHz), odnosno on par sa vec najavljenim Xeonom na 3GHz.

Ti mi procenti mnogo odredjeno zvuce, a ne definise se o kakvom sistemu je rec. Ako se radi o Single CPU sistemu to je sjajno, znaci da ce u dual i quad CPU sistemima Barsa drati Clovertown. Medjutim ako se brojke odnose na quad CPU sisteme, znaci da ce Barsa biti sporija od single CPU Clovertown sistema.

Ace Rimmer · 01.03.2007

Ima i Anand što reći i Barceloni

:
http://www.anandtech.com/cpuchipsets/showdoc.aspx?i=2939

ivanbo2003 · 01.03.2007

Bogda je napisao(la):
Double digit znaci 10-ak % brze od trenutno najbrzeg Xeona X5355 (na 2.66GHz), odnosno on par sa vec najavljenim Xeonom na 3GHz.

Ti mi procenti mnogo odredjeno zvuce, a ne definise se o kakvom sistemu je rec. Ako se radi o Single CPU sistemu to je sjajno, znaci da ce u dual i quad CPU sistemima Barsa drati Clovertown. Medjutim ako se brojke odnose na quad CPU sisteme, znaci da ce Barsa biti sporija od single CPU Clovertown sistema.

Pa naravno da se brojke odnose na quad core vs quad core.Sta ce biti u 2 way i 4 way sistemima,nije tesko pretpostaviti,bice jos gore po Clowertona(eno test na Inq-u od naseg coveka Nebojse Novakovica,2xQC Clowerton je maltene sporiji u vecini aplikacija od QC Kenstfielda na 10% vecem taktu...

A double digit ne verujem da je "samo" 10%.Da mi bolje sacekamo i vidimo.

drfedja · 01.03.2007

Double digit moze da bude od 10 do 99 %. Klok za klok, Barsa ce biti verovatno najefikasniji procesor do sada.
@Bogda: U multi CPU sistemima Xeon je i do sada tesko izlazio na kraj sa obicnim K8 Opteronima , a u ovom slucaju ce biti sigurno jos mnogo gore. Pored toga, shared L3 ce sigurno smanjiti snoop latency problem u komunikaciji u mp sistemima.

Bogda · 01.03.2007

Teoretski je tako ali kao sto Q2 znaci 25 jun tako i double digit znaci 10-ak procenata.
Malo mi postaje dosadno da ponavljam istu pricu ali sta cu kad se pokaze kao istinita.

A u ovom teksticu mi je najsmesnije ono 42% higher FPU perfomance. To mi zvuci kao iz reklama: izduzuje trepavice 42% vise nego ostale maskare.

I na kraju ako je verovati pisaniji Q2 znaci "this fall" odnosno mnogo gore od moje pretpostavke 25 jun.

Barcelona - konkretne brojke

Čuven

Čuven

Čuven

Slavan

Čuven

Čuven

Čuven

Slavan

Čuven

Slavan

Čuven

Čuven

Čuven

Čuven

Čuven

Slavan

Čuven

Čuven

Slavan

Čuven

Čuven

Čuven

Čuven

Čuven

Slavan

Čuven

Slavan

Slavan

Čuven

Čuven