Šta je novo?

Athlon64 4000+

  • Začetnik teme Začetnik teme Nedjo
  • Datum pokretanja Datum pokretanja
Typhoon.X je napisao(la):
Ima neshto interesantno u ovim screenshotovima CPU-Z :
Koliko se ja secam, A64FX i Opteron jezgra su imala codename SledgeHammer, a na screenu gde se prikazuje ovaj FX55 pishe da je ClawHammer... Dalje, trebalo bi da je prakticno jedina razlika izmedju Sledge i ClawHammer jezgra, DC kontroler... E sad, koliko izgleda po ovom screenu, AMD je modifikovao ClawHammer jezgro da koristi DC i preimenovao te processore u FX ??? Ako neko ima uvid u ovu problematiku molio bih da me prosvetli...

:wave:

Prve verije FX-a i jesu bile bazirane na Sledge-u koji ima memorijski kontroler koji radi samo sa ECC memorijom (Opteron i prvi FX-evi, stim da postoji zackoljica izmedju ECC i ECC Registered memorije). Nove verzije FX-a za S939 su bazirane na ClawHammer jezgru koje moze da radi i sa obicnom unbuffered memorijom. To je ujedno i najznacajnija razlika izmedju ta dva jezgra, a ne DC kontroler koji AMD po potrebi disableuje i spakuje procesor u pakovanje sa manje pinova.
 
ZorMi je napisao(la):
Intel je 30x veća firma od AMDa po vrednosti na berzi, može da kupi ceo AMD za svoj tromesečni profit, ali ne sme zbog antimonopolskih zakona. Ne verujem ni da ih zanima naročito...

Npr. na sajtu http://www.smartmoney.com/eqsnaps/index.cfm?story=competition&symbol=INTC&fk=3646 kad se izabere Rank By: Market Value vidi se da su Intelu glavni konkurenti u oblasti poluprovodnika: Texas Instruments (daleko ispod), pa ADI, pa Maxim... pa tek onda AMD. Svi oni zajedno vrede upola Intela. PC procesori nisu jedini izvor prihoda.

Ako se izabere Rank by: Net Earnings (neto zarada) situacija je još komičnija: AMD zaradjuje $90mil godišnje a Intel $7.3mlrd (82x više!!). AMD procesori se troše po Aziji, dosta po Evropi (uglavnom upućeniji kupci) i nešto malo po USA. Tamo je najveće tržište i tamo Intel vlada. Ne navijam za Intel (radim u firmi koja zastupa AMD) samo ne treba imati neke iluzije kako se ravnopravni takmaci.
Ja ovde nisam pricao o finansijama i ekonomskoj snazi, vec o proizvodnim kapacitetima. Bilo kako bilo situacija na trzistu procesora takva, da je AMD prigrabio 20% trzista, bez obzira na to koliki profit ima Intel, a koliki AMD. Uostalom, spomenuo sam da je to borba Davida i Golijata.
 
delimir je napisao(la):
Ma nije to nista sporno. Znam ja da zbog integrisanog mem.kontrolera A64 ima FSB jednak taktu procesora, pa samim tim ume itekako da iskoristi dual chanell (cak mu je i to malo, tj. mogao bi i neki 4x DDR400 mod da iskoristi kada bi tako nesto bilo implementirano), ali zbog kratkog pipelinea nema toliko potrebe da se cesto kao P4 obraca sistemskoj memoriji, pa su samim tim i beneficije od brzog rada sa memorijom drasticno manje.
Nije samo problem u arhitekturi procesora, nego u samom softveru koji se uglavnom izvrsava u L1 i L2 kesu i relativno malim segmentima memorije. Ekstremni slucaj su tzv. "streaming" aplikacije koje zahtevaju memorijski protok. Primer je DVD konverzija koja na Socket939 platformi radi ultra brzo. Naravno, na Intelu radi mozda za nijansu brze zbog 1 GHZ veceg takta i SSE2 optimizacije, ali ce na A64 Dual Chanell pokazati pravu snagu na vecim radnim taktovima procesora i sa 64-bitnim optimizacijama. Rad sa 64-bitnim patternima ce zahtevati tacno dva puta veci mem. protok, a da ne pricamo sta ce biti na 2.8 i vise gigaherca, ili sa dual core Opteron cipovima.
Za sada, kod izvrsavanja velike vecine "branch" koda A64 benificira od niske latencije integrisanog memorijskog kontrolera.

delimir je napisao(la):
Sigurno si primetio i da P4 kada su saseces L2 kes ili dodas, kako hoce, dobija znatno losije/bolje performanse. Kod A64 to nije slucaj u tolikoj meri iz istog razloga kao sa memorijom.
A64 kao prvo ima 128K L1 kesa, sto mnogo znaci. PIII je imao 10-stepeni pipeline, kao i Athlon, pa je Celeron (bogalj) radio daleko slabije od Durona, koji je cak imao manje L2 kesa od Celerona. PIII je bio po IPC broju blizak, t.j. izmedju Durona i Athlona. PIII je bio "neznatnih" 30-40% brzi od "bogalja". Secam se samo da je moj nekadasnji Duron na 600 Mhz radio brze od Celerona na 800 Mhz FSB100 Mhz.
Cela stvar je u tome sto AMD-ovi procesori u odnosu na Intelove imaju veci "cache hit rate" , u 128K L1 kesa se nadje 92% potrebnih informacija, u 256K L2 se nadje jos 93% od tih 8% miss rate-a iz L1 kesa. Athlon i Athlon 64 imaju 16-way associative L2, koji znacajno povecava "hit rate".
S' druge strane Intel, zahvaljujuci manjoj asocijativnosti, ostvaruje veci transfer L2 kesa, a tu je naravno i 256-bitni transfer. Samim tim P4 zahteva velik transfer memorije. Uostalom, dovoljno je da vidis rezultat L2 kes transfera u Science marku na 845 cipsetu i na 875p cipsetu, sa P4 CPU-om na recimo 2.4 Ghz.
Intel je posebnim prefetch mehanizmima anulirao negativne uticaje povecane latencije kesa i magistrale, narocito L2 (P4 ima preko 24 ciklusa latenciju L2, dok A64 ima oko 16 ciklusa), Intel omogucuje da njihovi procesori traze veci protok, umesto nize latencije. Prescott ima jos vecu latenciju kesa, a povecana je i latencija L1 kesa sa 2 na 4 ciklusa. Ipak, Prescott ne gubi puno od NW jezgra zato sto je taj isti L1 povecan, kao i naravno L2. Jednom reciju, Intel je Prescott-a optimizovao za DDR2.
delimir je napisao(la):
Zabavni softver tj. igrice su skoro jedini softver danas koji ume da iskoristi blagodeti veceg kesa i brzeg pristupa memoriji, ali opet mislim da je snizena latencija znacajnija i za igrice nego li veliki protok, ali sa visokom latencijom memorije. Zato A64 i cepa P4 u D3...
Naravno, ni P4 nije imun na visoke latencije. To se jako lepo vidi, P4 na 250 Mhz FSB-u sa memorijom na 250 CL3 4-4-8 radi kudikamo sporije u 3D-u od istog takvog P4 sa 250 FSB-om i asinhronom memorijom na 200 Mhz na CL2 2-2-6.
Uostalom masa igrica ima u sebi vrlo malo data stream-a. Sve se svodi na komunikaciju procesora sa memorijom i GPU-om koji svake sekunde vrsi milione poligonskih proracuna. Masa tekstura se kopira iz RAM-a preko AGP-a ili PEG interfejsa u Video RAM i to bez koriscenja procesora.
 
Poslednja izmena:
delimir je napisao(la):
Prve verije FX-a i jesu bile bazirane na Sledge-u koji ima memorijski kontroler koji radi samo sa ECC memorijom (Opteron i prvi FX-evi, stim da postoji zackoljica izmedju ECC i ECC Registered memorije). Nove verzije FX-a za S939 su bazirane na ClawHammer jezgru koje moze da radi i sa obicnom unbuffered memorijom. To je ujedno i najznacajnija razlika izmedju ta dva jezgra, a ne DC kontroler koji AMD po potrebi disableuje i spakuje procesor u pakovanje sa manje pinova.

10x na infou 🙂
 
delimir je napisao(la):
Sigurno si primetio i da P4 kada su saseces L2 kes ili dodas, kako hoce, dobija znatno losije/bolje performanse. Kod A64 to nije slucaj u tolikoj meri iz istog razloga kao sa memorijom.

A64 vise benefituje od dual-chanel memorijskog kontrolera nego od povecanja cache-a sa 512KB na 1MB. Zato je AMD i izbacio newcastle jezgo, i zato vrednuje dual-chanel sa 300 'MHz-poena' a dodatnih 512KB cache-a sa 200 'MHz-poena'.

MC
 
mcekovic je napisao(la):
A64 vise benefituje od dual-chanel memorijskog kontrolera nego od povecanja cache-a sa 512KB na 1MB. Zato je AMD i izbacio newcastle jezgo, i zato vrednuje dual-chanel sa 300 'MHz-poena' a dodatnih 512KB cache-a sa 200 'MHz-poena'.

MC
Dobro sroceno, nema sta... 🙂
 
mcekovic je napisao(la):
A64 vise benefituje od dual-chanel memorijskog kontrolera nego od povecanja cache-a sa 512KB na 1MB. Zato je AMD i izbacio newcastle jezgo, i zato vrednuje dual-chanel sa 300 'MHz-poena' a dodatnih 512KB cache-a sa 200 'MHz-poena'.

MC
To je apsolutno tacno, osim u ekstremnim situacijama kada je L2 kes napunjen kodom, a latencija izvrsavanja skace sa 12-16 ciklusa na 80-90 ciklusa koliko je potrebno da se podatak dobije iz RAM-a, kod A64 CPU-a, a kod P4 i AXP cak 200-inak.
Primer je recimo igra Comanche 4, ciji je Voxel endzin toliko zahtrevan po pitanju L2 kesa da je sa svakim dodavanjem kesa razlika ocigledna. Cak, stavise Voxel endzin ne trazi narocit memorijski protok, na vecim FSB-ovima razlika je neprimetna.
Primera radi, na CPU-ovima sa malo L2 kesa, kao sto su Duron ili Celeron, Comanche 4 u odredjenim trenucima ide bukvalno 1 FPS.
Thoroughbred je opet primetno sporiji od recimo Barton jezgra u ovom testu, a Clawhammer sa 1MB L2 kesa je opet nekih 10-tak FPS brzi od Newcastle-a sa 512K L2.
Isto tako i P4, Extreme Edition je najbrzi u ovoj igri, medju Intelovim CPU-ovima, pa zatim Northwood, a izuzetak je PressHot koji je nesto sporiji od Northwood-a, iako ima 1MB L2.
 
Nazad
Vrh Dno