Conroe izgleda jede FX za dorucak?

illidan · 12.03.2006

Nedjo · 13.03.2006

audiofreak je napisao(la):
A ne rece oce li imati Conroe SSE4 ili tek Merom, sta mislis (s obzirom da ih zovu Merom New Instructions)?

Mislim da dosta ljudi po netu kumuje nekim stvarima za koje Intel ima pripremljenu potpuno drugaciju tehnologiju i mislim da to rade zato sto ima jos uvek ono sto je Intel predstavio nije bas najjasnije. Takodje imatu dosta i marketinga jer Intel zeli da utera u ushi kodna imena za sva tri procesora, mada su sva tri zapravo jedno jezgro. Zvanicno Intel nigdenije pomenuo SSE4 i MNI i ne vidim razloga zasto bi se sada novinari i entuzijasti bavili izmisljanjem, kada vec postoje zvanicna imena (ajde, da se jos nista zvanicno ne zna, ali posle IDF-a barem je terminologija i naziv arhitekture ozvanicen - jos uvek se cekaju detaljnija tumacenja samih arhitektonskih resenja, ali obzirom da je tu zaista dosta novih stvari, treba sazvakati sve to, pa plasirati u javnost)

A kada smo vec kod plasiranja u javnost, Do sada smo imali "Paper" lansiranja, a sada evo imamo i "Ghost" lansiranja. Na povlascenim sajtovima se javljaju informacije i benchmarci iako samih proizvoda nema nigde na vidiku. Jasno je da se ovo smisljeno radi kako bi se trziste stavilo u "stend by" rezim i kako bi planirano junsko lansiranje FX62-ke propalo (zato je Anad overklokovao FX60)! Ovo je do sada najestremniji marketing koji je bilo koja od kompanija iz "core component" biznisa u IT-u uradila!

Inace, juce sam pricao sa covekom iz Intela i spletom srecnih okolnosti (zzesce su ga smorili neki kinezi koji jeddva pricaju engleski i ne znaju da Intel vec ima 64bitni x86 CPU), tako da je bio prilicno raspolozen za pricu sa nekim kome je engleski mnogo razumljiviji. LM, Indijac kaze da Conroe u masovnim kolicinama stize u Q4!
Pitam ga ja da mi pokaze Conroe-a (posto stoji pored dve masine na kojima su 965 stickeri). I on mi otvara vrata na tezgi na kojoj su masine (nalik kuhinjskim radnim stolovima) i pokazuje mi pravu Conroe mashinu koja zapravo baca signal na ta dva monitora

Caskali smo jos, ali o tome u sledecem postu posto sad palim dalje na sastanke!
:wave:

audiofreak · 13.03.2006

Nedjo je napisao(la):
Zvanicno Intel nigde nije pomenuo SSE4 i MNI i ne vidim razloga zasto bi se sada novinari i entuzijasti bavili izmisljanjem

Pa nisam se ja pozvao na njih nego na pisce koda za GNU asembler, oni su te ekstenzije krstili MNI. Ako je podrska za generisanje SSE4 opcodes vec ubacena u GAS, ocigledno je da ipak nesto znaju zar ne?

Nedjo je napisao(la):
LM, Indijac kaze da Conroe u masovnim kolicinama stize u Q4!

Pa to sam i ja svojevremeno rekao ovde, sta je tu novo? :trust:

Nedjo je napisao(la):
Pitam ga ja da mi pokaze Conroe-a (posto stoji pored dve masine na kojima su 965 stickeri). I on mi otvara vrata na tezgi na kojoj su masine (nalik kuhinjskim radnim stolovima) i pokazuje mi pravu Conroe mashinu koja zapravo baca signal na ta dva monitora

Ahahah, zesca frka da im neko (prvo slovo A, trece i poslednje D, khm, khm) ne ukrade procesor :d

Bas me zanima sta si ga jos pitao?

okmijun · 13.03.2006

znaci mass attack na jesen!!!!

Nedjo · 13.03.2006

okmijun je napisao(la):
znaci mass attack na jesen!!!!

Da na jesen. danas sam pricao jos sa nekim proizvodjacima ploca (na svim standovima se vijore novi Intel Logoi i narocito Logo za 965 (Intel kani da od ovog chipseta napravi novi BX, kada je popularnost u pitanju). Uglavnom, na konto price o 965, svi kazu da ploce stizu pre "back2school" sezonu. Naizvesniji scenario je da ce veliki brendovi pocetkom ove sezone biti prvi sa Conroe mashinama, a da ce se onda pocetkom jeseni procesor plasirati u kanal za WB asemblere i za retail prodaju u BOX-u).

LM, Indijac... Na moju konstataciju da imaju odlican procesor i da ce dobrano podprasiti "zelene" (pokazujuci prstom na AMD-ov stand koji je dijagonalno), on mi je odgovorio sa "yeah... well... I think that they will have respond" Gde sam ga ja prekinuo sa novom konstataciojom da su oni prilicno tihi vec duze vreme, sto je on prokomentarisao: "pa i mi smo bili tihi u proslosti"...

Bilo kako, generalni stav medju ljudima u industriji "core" komponenti je da ce Intel imati "performance lead" godinu dana, a da ce AMD voditi borbu putem cena (jedan od razloga zasto se uzurbano ramp-upuje Fab36 je da od jeseni kada izadje Conroe krene u masovnu 65nm proizvodnju sto ce omoguciti AMD-u da snizava cene).

LM, evo jos jedne slike. U pitanju je G965 chipset sa integrisanom (prva DX10 integrisana) grafikom.

audiofreak · 13.03.2006

Imam osecaj da ce taj 965G biti bomba za SFF racunare.
Sto ne pita za SSE4, odnosno preciznije formulisano "da li conroe ima neke ekstenizije seta instrukcija" posto ti detalje verovatno ne bi rekli?

audiofreak · 14.03.2006

Link

Objasnjenje zasto nije koriscen RD580 cipset -- zato sto je on 2x 16xPCIe, a Intelov je 2x 8xPCIe pa ne bi bilo fer.

Nedjo · 14.03.2006

audiofreak je napisao(la):
Link

Objasnjenje zasto nije koriscen RD580 cipset -- zato sto je on 2x 16xPCIe, a Intelov je 2x 8xPCIe pa ne bi bilo fer.

To stoji, ali isto tako stoji da je trebao da koristi single graficku i to jednu u NF4 SLI, a drugu u 975X ploci.... a ne da se glupira sa CroSSFireom... ma... trla baba lan... za sest meseci ce konacno moci da se vidi prava slika kada se budu koristili 965 chipset za Conroe i nForce 590 za AM2... do tada ovo je super za navrtanje brojaca na web strani

audiofreak · 14.03.2006

Jesi se ti to vec vratio iz Han(g)overa? Ako nisi da te zamolim nesto dok si tamo

Nedjo · 14.03.2006

audiofreak je napisao(la):
Jesi se ti to vec vratio iz Han(g)overa? Ako nisi da te zamolim nesto dok si tamo

rekni!

Sve sto je u mojoj moci!

audiofreak · 15.03.2006

Nedjo je napisao(la):
rekni! Sve sto je u mojoj moci!

Poslao sam ti pm.

@all:
Evo sada Rahul menja pesmu o Conroe .vs. AMD:
link
:-devil-:

starac · 15.03.2006

Čovjek nije promijenio mišljenje nego je samo malo umjereniji. Primjetio je da nešto tu ne štima,da ima grešaka. To je uostalom primjetila i većina na ovom forumu.
Da kojim slučajem nije progovorio razlika bi i dalje ostala ista.

stormwatch153 · 16.03.2006

audiofreak je napisao(la):
Poslao sam ti pm.

@all:
Evo sada Rahul menja pesmu o Conroe .vs. AMD:
link
:-devil-:

Pa nisam bas video da je promenio pesmu, prednost je sa prvobitnih rekla-kazala sa duplo brze pala na 40% posle onog namestenog testa, a posle revizije u kojoj je sve bilo raskrinkano nakon 2 dana prednost se opet spustila na milimetar preko 20%, sto se tice Intela nije lose, konacno su uspeli da naprave nesto brzi procesor od AMD-a, njihova najsavremenija tehnologija radi 20.1% brze od 4 godine stare AMD tehnologije.

E i jos jedno pitanje u vezi testa, kako to da overklokovani FX60 radi sporije od neklokovanog FX60???

illidan · 17.03.2006

stormwatch153 je napisao(la):
Pa nisam bas video da je promenio pesmu, prednost je sa prvobitnih rekla-kazala sa duplo brze pala na 40% posle onog namestenog testa, a posle revizije u kojoj je sve bilo raskrinkano nakon 2 dana prednost se opet spustila na milimetar preko 20%, sto se tice Intela nije lose, konacno su uspeli da naprave nesto brzi procesor od AMD-a, njihova najsavremenija tehnologija radi 20.1% brze od 4 godine stare AMD tehnologije.

E i jos jedno pitanje u vezi testa, kako to da overklokovani FX60 radi sporije od neklokovanog FX60???

pa Conroe izlazi za 6 meseci, mislis da ce prednost i posle 6 meseci biti 20%
btw meni je i 2% dovoljno

stormwatch153 · 17.03.2006

illidan je napisao(la):
pa Conroe izlazi za 6 meseci, mislis da ce prednost i posle 6 meseci biti 20%
btw meni je i 2% dovoljno

Sto se mene tice moze Conroe biti i duplo brzi, AMD ce sa novom generacijom procesora opet napraviti dobar posao (ne mislim na AM2 i DDR2(3) podrsku) pa ce Intel i sa Conroe arhitekturom opet biti u poludecenijskom zaostatku.

genijalcin@23 · 17.03.2006

U to nema sumnje... :d

stormwatch153 · 17.03.2006

Hm...u sta nema sumnje???

drfedja · 17.03.2006

stormwatch153 je napisao(la):
Sto se mene tice moze Conroe biti i duplo brzi, AMD ce sa novom generacijom procesora opet napraviti dobar posao (ne mislim na AM2 i DDR2(3) podrsku) pa ce Intel i sa Conroe arhitekturom opet biti u poludecenijskom zaostatku.

Niko nece ni za kim biti u poludecenijskom zaostatku. Niti ce Conroe biti toliko jak, niti ce AMD napraviti chudoviste od procesora za pola godine. Iskreno, mislim da woodcrest u multiprocesorskim masinama itekako nece "jesti za dorucak" multiprocesorske Opteron masine, narocito kada i AMD predje na 65nm. Sto se desktop trzista tice, videcemo... i ljudi iz Intela i iz AMD-a su prilicno uzdrzani, a to da ce Conroe biti 20% brzi, pitanje je samo od chega i u chemu.
Performanse AM2 procesora ako budu na 2.4 ghz 3-5% brze to uopste onda nije lose, na 2.8 - 3.0 ghz ce biti jos bolje.

mcekovic · 17.03.2006

stormwatch153 je napisao(la):
Sto se mene tice moze Conroe biti i duplo brzi, AMD ce sa novom generacijom procesora opet napraviti dobar posao (ne mislim na AM2 i DDR2(3) podrsku) pa ce Intel i sa Conroe arhitekturom opet biti u poludecenijskom zaostatku.

Kad malo bolje covek razmisli, tesko da ce Conroe da bude toliko brzi koliko pokaziju benchmark-ci. Mislim da su izabrali bas benchmarke gde veliki i brz cache dolazi do izrazaja najvise, te da Conroe nema sanse da bude brzi od A64 za vise od 10% takt-za-takt na frekfencijama od oko 2.5 GHz.

A64 je prilicno optimizovan i po prirodi stvari tesko je moguce optimizovati jedan CPU core da ima veci IPC. Teoriski je to tesko moguce, jer sekvencijalo izvrsavanje x86 instrukcija ima svoje teorijske limite po pitanju IPC-a (zavisnost instrukcija po podatcima).

Dajem im max 10%, a ni AMD nece moci da izvuce vise. Posto se ne mogu vise povecavati GHz-i, jedino ostaju multi core i (verovali ili ne) hyper-threading (ali implementiran kako valja, kao u IBM Power 5 ili Sun Niagara).
Nadam se da ce AMD promeniti misljenje oko poslednjeg, kao i da ce se Intel vratiti na hyper-threading.

Sto se tice multi-core-a, izgleda da ce Intel tu u biti prednosti, jer ima bolji proces. A proces za multi-core mnogo vise znaci nego inter-core komunikacija, jer 4 je duplo vise od 2, a tesko da se takva razlika moze ostvariti brzom inter-core komunikaciom. A tu je i shared-cache, koji je verovatno cak i bitniji nego efikasna inter-core komunikacija i integrisani memorijski kontroler.

Dakle, ako AMD nema keca u rukavu, lose mu se pise. A nadam se da ima, shared-cache?, efikasniji pipeline (vise fetch, decode i execution jedinica)?, brzi prelazak na sitniji proces?

genijalcin@23 · 17.03.2006

stormwatch je napisao(la):
Hm...u sta nema sumnje???

Da ce biti u polu-decenijskom zaostatku.

mcekovic je napisao(la):
A64 je prilicno optimizovan i po prirodi stvari tesko je moguce optimizovati jedan CPU core da ima veci IPC. Teoriski je to tesko moguce, jer sekvencijalo izvrsavanje x86 instrukcija ima svoje teorijske limite po pitanju IPC-a (zavisnost instrukcija po podatcima).

Uvek se moze povecati IPC (malo je glup primer, ali je aktuelan - Conroe ce izvrsavati sve 128 bit SSE instrukcije u jednom ciklusu), samo sto mi to ne mozemo da vidimo/pretpostavimo, jer nemamo uvid u ono sto ljudi rade/smisljaju/realizuju. Ljudi su jos '70-ih pravili istrazivanja o out-of-order izvrsavanju, da bi 20 godina kasnije to bilo implementirano u IBM i Intel procesore. Ko je mogao i da pretpostavi da ce out-of-order biti toliko vazan i da ce na kraju uspeti da ga implementiraju?

mcekovic je napisao(la):
Dajem im max 10%, a ni AMD nece moci da izvuce vise. Posto se ne mogu vise povecavati GHz-i, jedino ostaju multi core

Ko kaze da se ne mogu povecavati GHz?

mcekovic je napisao(la):
i (verovali ili ne) hyper-threading (ali implementiran kako valja, kao u IBM Power 5 ili Sun Niagara).
Nadam se da ce AMD promeniti misljenje oko poslednjeg, kao i da ce se Intel vratiti na hyper-threading.

A sad i nije toliko los taj HT, a? :d HT nije lose implementiran, koliko je softver neoptimizovan. Sa druge strane, ne treba ocekivati brda i doline od mainstream procesora (poredjenje sa Nijagarom nikako nije na mestu). Steta sto je Intel odlucio da HT ucini malo ekluzivnijim, ali cenim da ce u vreme QuadCore procesora, dvojezgarni procesori (celeroni :d ) imati HT.

mcekovic je napisao(la):
Sto se tice multi-core-a, izgleda da ce Intel tu u biti prednosti, jer ima bolji proces. A proces za multi-core mnogo vise znaci nego inter-core komunikacija, jer 4 je duplo vise od 2, a tesko da se takva razlika moze ostvariti brzom inter-core komunikaciom. A tu je i shared-cache, koji je verovatno cak i bitniji nego efikasna inter-core komunikacija i integrisani memorijski kontroler.

Lepo sroceno. Steta sto ljudi tek sada uvidjaju prednosti jeftinijeg i boljeg procesa proizvodnje. Samo kada se setim onih rasprava da je AMD pravi DualCore procesor, a PD Multi-dual chip budzevina.

@all
Ali zasto, zasto se smarate i gadjate sa procentima? Kakve ce performanse biti - cuce se. :d

Jedino o cemu se moze diskutovati je o arhitekturi.

mcekovic · 17.03.2006

genijalcin@23 je napisao(la):
Uvek se moze povecati IPC (evo ti primer SSE-a), samo sto mi to ne mozemo da vidimo/pretpostavimo, jer nemamo uvid u ono sto ljudi rade/smisljaju/realizuju.

Rekao sam x86 instrukcija. Dodavanje novih instrukcija moze (a ne mora, MMX?) da dovede do globalnog efekta tek nakon 2-3 godine od pojave u prvim procesorima.

genijalcin@23 je napisao(la):
Ko kaze da se ne mogu povecavati GHz?

OK, mislio sam na znacajno povecanje performansi povecavanjem frekfencije.

genijalcin@23 je napisao(la):
A sad i nije toliko los taj HT, a? :d HT nije lose implementiran, koliko je softver neoptimizovan.

Naravno da nije los kad se dobro napravi. Pogledaj TPC-C benchmark http://www.tpc.org/tpcc/results/tpcc_perf_results.asp i videces kako IBM Power 5 dere ostale (Power 5 je 4-way procesor, 2 core x 2 thread). A Sun Fire T1 'Niagara' dere sve u web server benchmarcima (Nijagara je 32-way procesor, 8 core x 4 thread), i pored jako jednostavnih i relativno neefikasnih core-a (nema out-of-order execution).

genijalcin@23 · 17.03.2006

Kao sto rekoh u editovanom postu, koji nisi video...Nemoj da poredis implementaciju HT u Nijagari i P4, jer se radi o dijametralno drugacijim procesorima i pristupima.

I naravno da ce Nijagara da dere u svim web server benchmarcima, jer je za to i napravljena.

P4 je ipak neki mainstream...

mcekovic · 17.03.2006

genijalcin@23 je napisao(la):
P4 je ipak neki mainstream...

P4 i NetBurst je ipak za zaborav

, siguran sam da bi i Intel vise voleo da ga nije ni bilo

Nedjo · 17.03.2006

genijalcin@23 je napisao(la):
Lepo sroceno. Steta sto ljudi tek sada uvidjaju prednosti jeftinijeg i boljeg procesa proizvodnje. Samo kada se setim onih rasprava da je AMD pravi DualCore procesor, a PD Multi-dual chip budzevina.

Pa kad jeste Multichip (ne bih upotrebio rec "Budzevina"). Pa IBM je odavno koristio MCM tehnologiju za svoje serverske procesore i nikada nije nazivao stavljanje cetiri Power jezgra u jedno pakovanje QuadCore vec MCM (Multichip Module)...

mcekovic · 17.03.2006

genijalcin@23 je napisao(la):
HT nije lose implementiran, koliko je softver neoptimizovan.

Optimizuja za HT je ista kao i za multi-core, tj. pisanje multi-threaded software-a.
A sto se tice Intel-ove implementacije HT-a u NetBurst-u, ona je tu samo da bi pokrila katastrofalno los IPC koji je posledica dugackog pipeline-a. Nema dodatnih fetch i decode linija, nema vise izvsnih jedinice, dakle samo pokrivanje 'rupa' u izvrsavanju prouzrokovanih dugackim pipeline-om, pogresno predvidjenim branch-ovima i zavisnim instrukcijama po podacima (mislim ako ovo vec nije dovoljno puta receno, onda...)

IBM je u Power 5 povecao sve gore navedeno, a performanse svedoce o isplativosti pristupa (skoro da se ponasa kao quad-core procesor).

Sto se tice Niagare, Sun je namerno napravio sto jednostavaniji core u pocetnoj verziji kako bi smanjio troskove razvoja i time-to-market (niko nije ni blizu Sun-u po broju simultanih thread-ova (32) i performance-per-wat). Naravno da se Niagara ne moze porediti sa main-stream procesorima, pomenuo sam je samo kao ilustraciju da dobro implementiran hyper-treading moze da donese i dobre performanse.

drfedja · 17.03.2006

mcekovic je napisao(la):
Kad malo bolje covek razmisli, tesko da ce Conroe da bude toliko brzi koliko pokaziju benchmark-ci. Mislim da su izabrali bas benchmarke gde veliki i brz cache dolazi do izrazaja najvise, te da Conroe nema sanse da bude brzi od A64 za vise od 10% takt-za-takt na frekfencijama od oko 2.5 GHz.

Oni benchmarci ne pokazuju nista. Sigurno je da su se ljudi iz Intela potrudili da serviraju malo iskrivljenu sliku o superiornim performansama Conroe-a. Kakve su zaista performanse, to ostaje da se vidi. Koliko ce zaista siri execution core doneti ubrzanja, izvrsavanje 128-bit SSE instrukcije u jednom ciklusu, takodje ostaje da se vidi.

mcekovic je napisao(la):
A64 je prilicno optimizovan i po prirodi stvari tesko je moguce optimizovati jedan CPU core da ima veci IPC. Teoriski je to tesko moguce, jer sekvencijalo izvrsavanje x86 instrukcija ima svoje teorijske limite po pitanju IPC-a (zavisnost instrukcija po podatcima).

Moze se povecati IPC, ali u malim koracima. Dakle, tesko da mozes ocekivati odjednom 20-30%.

mcekovic je napisao(la):
Dajem im max 10%, a ni AMD nece moci da izvuce vise. Posto se ne mogu vise povecavati GHz-i, jedino ostaju multi core i (verovali ili ne) hyper-threading (ali implementiran kako valja, kao u IBM Power 5 ili Sun Niagara).
Nadam se da ce AMD promeniti misljenje oko poslednjeg, kao i da ce se Intel vratiti na hyper-threading.

Ako intel implementira SMT u Conroe, zasto to ne bi uradio i AMD sa svojim K8 jezgrima.
Sirina K8 execution core-a uopste nije limitirana, samo je pitanje da li se moze postici ILP ili TLP.
K8 ima 6 integer pajpova, sa po tri adresna, i 6 FP pajpova i takodje moze da odradi po jednu 128-bit SSE u jednom ciklusu.
Evo sta kazu na chip arhitect-u:

Appendix C of Opteron's Optimization Guide specifies to which class each and every instruction belongs. Most 128 bit SSE and SSE2 instructions are implemented as double dispatch instructions. Only those that can not be split into two independent 64 bit operations are handled as Vector Path (Micro Code) instructions. Those SSE2 instructions that operate on only one half of a 128 bit register are implemented as a single (Direct Path) instruction.

Dakle, SSE2 bandwidth nije limitiran dekodiranjem doticnih instrukcija, vec brojem izvrsnih jedinica. U jednom ciklusu moguce je dekodirati do 1.5 SSE2 instrukcija, a FP bandwidth je limitiran na max. jednu 128-bit SSE2 instrukciju u ciklusu. Ukoliko Conroe bude mogao da out-of-order izvrsava 128-bit sse2 instrukcije u jednom ciklusu, onda je u velikoj prednosti.

mcekovic je napisao(la):
Sto se tice multi-core-a, izgleda da ce Intel tu u biti prednosti, jer ima bolji proces. A proces za multi-core mnogo vise znaci nego inter-core komunikacija, jer 4 je duplo vise od 2, a tesko da se takva razlika moze ostvariti brzom inter-core komunikaciom. A tu je i shared-cache, koji je verovatno cak i bitniji nego efikasna inter-core komunikacija i integrisani memorijski kontroler.

Intel nema bolji proces od IBM-a i AMD-a, samo ima raniji "ramp" na sitiniji proizvodni proces i vece proizvodne kapacitete. Kada Conroe izadje, tada bi trebalo da izadju i prvi 65nm procesori iz FAB36.
Shared cache ima vecu latencu od neshare-ovanog.
L2 Cache koherencija bi trebalo da je elegantnije resena u slucaju shareovanog cache-a. Da li je bolje imati crossbar komunikaciju ili samo shareovan high-latency L2 ostaje da se vidi. Mislim da ce novi AMD-ovi procesori imati i jedno i drugo. Shareovan L2 donosi prednost u ne-threadovanim aplikacijama, jer im jednostavno donosi vise cache-a po jezgru. Uostalom, mozes da vidis test Intel Yonah procesora, sa 2MB shareovanog kesa, peformanse su na nivou X2 3800+

mcekovic je napisao(la):
Dakle, ako AMD nema keca u rukavu, lose mu se pise. A nadam se da ima, shared-cache?, efikasniji pipeline (vise fetch, decode i execution jedinica)?, brzi prelazak na sitniji proces?

AMD uvek ima keca u rukavu - ima IBM-a.

genijalcin@23 · 17.03.2006

mcekovic je napisao(la):
P4 i NetBurst je ipak za zaborav , siguran sam da bi i Intel vise voleo da ga nije ni bilo

NetBurst ce ziveti i u buducim Intelovim procesorima. Zbog svoje specificne arhitekture predstavlja veliku skolu, ali ne u smislu "ne ponovilo se vise". Uopste ne sumnjam da ce Intel u buducnosti izvuci mnogo koristi iz ovog iskustva.

EDIT> uf, ala ste se raspisali, pisem novi post kada budem imao vremena...Za taj ce mi trebati malo vise vremena. Jedino ako me AF ne pretekne.

audiofreak · 17.03.2006

Evo primera kako su ovde neki "nepristrasni" navijaci u dve recenice iz istog pasusa:

#1:

drfedja je napisao(la):
a to da ce Conroe biti 20% brzi, pitanje je samo od chega i u chemu.

#2:

drfedja je napisao(la):
Performanse AM2 procesora ako budu na 2.4 ghz 3-5% brze to uopste onda nije lose, na 2.8 - 3.0 ghz ce biti jos bolje.

Po ovome bi covek mogao da zakljuci da je bolje biti 3-5% brzi od samog sebe nego 20% brzi od onog ko je to bio do sada.

Mislim, sta reci... :trust:

mcekovic je napisao(la):
genijalcin@23 je napisao(la):

Uvek se moze povecati IPC (evo ti primer SSE-a), samo sto mi to ne mozemo da vidimo/pretpostavimo, jer nemamo uvid u ono sto ljudi rade/smisljaju/realizuju.

Kliknite za proširenje...

Rekao sam x86 instrukcija. Dodavanje novih instrukcija moze (a ne mora, MMX?) da dovede do globalnog efekta tek nakon 2-3 godine od pojave u prvim procesorima.

Kako si dosao do ovog citata?!? Lepo je Uros rekao da ce se postojece 128-bitne SSE instrukcije (dakle sve vektorske odnosno one koje rade na 4x 32 bita) izvrsavati za 1T umesto za 2T kao do sada.

mcekovic je napisao(la):
P4 i NetBurst je ipak za zaborav , siguran sam da bi i Intel vise voleo da ga nije ni bilo

Kad bi jos samo pojedini ljudi shvatili koliko je NetBurst bio znacajan za razvoj i procesorske arhitekture i softvera i to ne samo Intelu...

mcekovic je napisao(la):
Optimizuja za HT je ista kao i za multi-core, tj. pisanje multi-threaded software-a.

Nece biti da je skroz isto, HT je malo *******iji jer se ne mogu koristiti isti resursi u isto vreme -- npr. ne mozes u oba threada da koristis FPU jer jednostavno nemas dva.

mcekovic je napisao(la):
ona je tu samo da bi pokrila katastrofalno los IPC koji je posledica dugackog pipeline-a.

Aman covece, shvati vec jednom da IPC ne zavisi samo od duzine pajplajna!!! Zavisi direktno od mixa instrukcija koje izvrsavas i od toga koliko je jezgro "naklonjeno" kojoj vrsti instrukcija. NetBurst je bio "stimovan" za SIMD i streaming, a doziveo je nepravdu da se na njemu izvrsava legacy DJUBRE od koda! Kako ne mozes da shvatis tako prostu cinjenicu?!?

drfedja je napisao(la):
samo ima raniji "ramp" na sitiniji proizvodni proces i vece proizvodne kapacitete

"Samo" je u ovom slucaju godinu dana ranije

driver · 17.03.2006

Ja vas nishta ne razumem

mcekovic · 17.03.2006

drfedja je napisao(la):
Oni benchmarci ne pokazuju nista. Sigurno je da su se ljudi iz Intela potrudili da serviraju malo iskrivljenu sliku o superiornim performansama Conroe-a. Kakve su zaista performanse, to ostaje da se vidi. Koliko ce zaista siri execution core doneti ubrzanja, izvrsavanje 128-bit SSE instrukcije u jednom ciklusu, takodje ostaje da se vidi.

Slazem se.

drfedja je napisao(la):
Moze se povecati IPC, ali u malim koracima. Dakle, tesko da mozes ocekivati odjednom 20-30%.

OK, ali teorijski limit ipak postoji, zbog zavisnosti instrukcija po podacima:
1. A = B + C;
2. B = A + D;
Druga instrukcija ne moze da se izvrsi dok se ne zavrsi prva.
I AMD i Intel su jako blizu tog limita. Ne verujem da je povecanje prosecnog x86 IPC-a po core-u od 20-30% u odnosu na sadasnje stanje teorijski moguce ikada.

drfedja je napisao(la):
Ako intel implementira SMT u Conroe, zasto to ne bi uradio i AMD sa svojim K8 jezgrima.
Sirina K8 execution core-a uopste nije limitirana, samo je pitanje da li se moze postici ILP ili TLP.
K8 ima 6 integer pajpova, sa po tri adresna, i 6 FP pajpova i takodje moze da odradi po jednu 128-bit SSE u jednom ciklusu.

Nadam se da hoce, ali u par interview-a koje sam procitao sa AMD zvanicnicima uvek se to kategoricki demantovalo, po pricipu HT = bljak-fuj.
Takodje, verujem da je razvoj SMT implementacije jako komplikovan i skup. Logicka kompleksnost procesora se dosta povecava, vise thread-ova se 'bori' za resurse jednog core-a, treba to sinhronizovati, puno prilika za bug-ove u procesoru. Multi-core pristup je logicki jednostavniji i jeftiniji za razvoj (ne i za proizvodnju, jer se neki resursi koji bi se mogli podeliti sigurno dupliraju).

drfedja je napisao(la):
Shared cache ima vecu latencu od neshare-ovanog.
L2 Cache koherencija bi trebalo da je elegantnije resena u slucaju shareovanog cache-a. Da li je bolje imati crossbar komunikaciju ili samo shareovan high-latency L2 ostaje da se vidi. Mislim da ce novi AMD-ovi procesori imati i jedno i drugo. Shareovan L2 donosi prednost u ne-threadovanim aplikacijama, jer im jednostavno donosi vise cache-a po jezgru. Uostalom, mozes da vidis test Intel Yonah procesora, sa 2MB shareovanog kesa, peformanse su na nivou X2 3800+

Shared-cache donosi ubrzanje i u multi-threaded aplikacijama, jer smanjuje potrebu za inter-core komunikacijom. Izgleda da Intel dobrim cache-om anulira i prestize AMD-ove glavne prednosti: integrisani memorijski kontroler i hyper-transport ('jednim udarcem ubija 2 muve'!).

AMD se okrenuo unapredjenjima eksterne komunikacije procesora (to je jednostavnije za razvoj!), dok i u AM2 kuca isti core kao i u prvom Athlon-u. Vreme je da malo porade i na tome.

Conroe izgleda jede FX za dorucak?

Nenadmašan

Čuven

Banned

Čuven

Čuven

Banned

Banned

Čuven

Banned

Čuven

Banned

Čuven

Banned

Nenadmašan

Banned

Banned

Banned

Čuven

Čuven

Banned

Čuven

Banned

Čuven

Čuven

Čuven

Čuven

Banned

Banned

Znamenit

Čuven