Šta je novo?

AMD noviteti 2007 (klapa2)

Po nekim glasinama,navodno FX64 treba da izadje 8. avgusta.Ko zna,mozda se i desi 🙂

Anyway,interesanta ova 2006 godina,pored Core2 po ovome:http://www.theinquirer.net/?article=32536 AMD ce imati pune ruke posla sa DELL-om 🙂.Posao izgleda dosta ozbiljniji od "par" opterona u 4S serverima,vec ide mnogo dalje(desktop,mobile)
 
Nedjo je napisao(la):
FX62 napravljen u cetvrtoj nedelji 2006 (krajem januara) na default voltazi radi na 3 GHz sa najobicnijim vazdusnim hladjenjem!
Ako se uzme u obzir da je AMD-ova pilot proizvodnja u 65nm krenula sa "zrelim" yieldom, sta mislis na koliko ce im moci raditi procesori napravljeni u 65nm u cetvrtoj nedelji 2007?!
Pa sigurno nece raditi na 4 Ghz! Ako budu radili na 3.2 - 3.4 bice super.
 
drfedja je napisao(la):
Pa sigurno nece raditi na 4 Ghz! Ako budu radili na 3.2 - 3.4 bice super.
65nm rev G ce sigurno izgurati 3.5 😉
 
Nedjo je napisao(la):
65nm rev G ce sigurno izgurati 3.5 😉
Ne verujem im nista dok ne vidim rezultate. 😉
Svi oni pricaju bajke i obecavaju kule i gradove i na kraju prc.
 
Citao sam to objasnjenje,ali je to samo "moguci " nacin funkcionisanja.
Jedna jos zanimljivija "pretpostavka" je da je K8 od pocetka zamisljen kao CPU koji ce podrzavati "paired" mode kada se pojavi Dual Core verzija(kroz ugradjeni hardver u pacifici tj AMD-V).Zato mozda i nema neke razlike izmedju RevF i RevE u onim mrljavim die shotovima koji su prikazani...
Dodata je AMD-V tehnologija pored ostalih sitnih poboljsanja.

BTW cela poenta je opisana u onom patentu u nekom od prethodnih postova(verovatno nesto usavrsenija i elegantnija implementacija nego iz tog patenta iz '99)
 
Poslednja izmena:
Dosta je tesko zakljuciti nesto iz patenata. Taj iz 1999. definise 4 instrukcije za rad sa spekulativnim thread-ovima ali nista ne govori o tome da li te instrukcije generise sam procesor ili ipak treba specijalan kompajler koji ce da generise odgovarajuci kod. U drugom slucaju, to u sustini nije nista novo. Intel je radio (i valjda jos radi?) na takvom projektu: Intel Mitosis. (I u ne-x86 svetu ima takvih projekata.)

U slucaju AMD-a je sigurno samo jedno: Ako stvarno postoji RHT, K8 je morao od starta biti prilagodjen za tako nesto. Da nije, cela stvar bi se vise nego jasno videla na rev. F die shot-ovima (sem ako AMD nije photoshop-ova die shotove pre nego sto su stigli u javnost, ali to vec ide u teoriju zavere 😀 ).

Ako su isli na neki sistem slican tom patentu iz '99, ali sa harderski generisanim threadovima, to bi izgledalo ovako:
Bilo bi jedno master i jedno slave jezgro gde bi master jezgro dekodirao sve instrukcije i kasnije jedan deo slao slave-u na izvrsavanje. U ovom slucaju decode postaje usko grlo i prakticno cini bilo kakavu tradicionalnu zamisao 6-way izvrsavanja besmislenom. U tom slicaju bi bilo najlogicnije da slave procesor izvrsava drugu stranu branch instrukcije - a patent bas definise Fork instrukciju koja to cini. Uz to bi slave jezgro moglo da sluzi i za neki tip load forwarding-a, mada je to veci znak pitanja.
Potrebne modifikacije jezgra: Dekoderi koji ce generisati odgovarajuci kod (moguca veza sa virtuelizacijom, ali nije sigurno); direktna veza izmedju jezgara na reorder buffer-u i bypass bus-u; buffer za prevodjenje instruction tag-ova sa jednog na drugi procesor i synchronization jedinica kao u patentu.

Drugi tip implementacije je onaj sto mnogi predlazu tj. da se dva procesora vide kao jedan 6-way i da tako funkcionisu od pocetka do kraja. Za tako nesto bi bilo potrebno da su jezgra izuzetno blisko povezana, pogotovo dekoderi. Opet bi postojalo master i slave jezgro, ali ovoga puta bi master fetchovao parne, a slave neparne linije koda (umesto da ih sve master dekodira kao u proslom slucaju). Tu problem predstavlja grananje, jer u tom slucaju jedno jezgro mora drugome da posalje adressu sledece instrukcije ili eventualno samo neka vrsta konstrole tako da master ponisti slave-ove instrukcije. Kako god bilo to mora da se izvede jako brzo - najvise 1 ciklus kasnjenja (idealno 0). Zbog toga dekoderi moraju biti izuzetno blisko povezani i mnogi govore da je to moguce samo ako jezgra dele jedinstveni dekoder. Posle dekodera problem nastaje kod register file-ova i schedulera, mada je ovo mnogo lakse resivo nego dekoderi. AMD ima patente i za simetricne scheduler-e povezane dependecy vector-om (mada je to po svemu sudeci namenjeno post-K8L jezgru). Dva reorder buffera nije tako veliki problem (Alpha EV6 radi tako uz 1 ciklus kasnjenja izmedju register file-ova), ali zbog specificnog dizajna 2xK8 bi morao imati komplementarne reorder buffere (umesto dve kopije istog kao kod Alphe) da bi mogao odrzati 6-way izvrsavanje. Sve u svemu ova druga implementacija nije uopste naivna.

Naravno, postoji i mogucnost da je ceo RHT rezultat igre gluvih telefona i da ce AMD u stvari da omoguci dinamicno iskljucivanje jednog jezgra i overklokovanje drugog. I tako bi mogli dobiti par % u single threaded programima.

S druge strane digla se prasina i oko Intel Core Multiplexing, koji je po jednima novi hyper-threading, po drugima intelov reverse HT, a mozda nije ni jedno ni drugo... Lik sa xtremesystems je rekao da na enabled sve radi normalno ali na disabled nece da se podigne sistem. Na osnovu toga bih rekao da se radi o tehnologiji vezanoj za FSB. Kad je multiplexing ukljucen FSB vidi dva jezgra kao jedno (pa FSB moze da radi na 1066 i 1333 za razliku od Preslera), a kad je iskljucen vidi kao dva opterecenja. To bi bar bilo u skladi sa klasicnim terminom multiplexing na polju slanja signala.

P.S. Cisto da dolijem malo ulja na AMD+ATI vatru 🙂
AMD Patent iz 2004 - CPU and graphics unit with shared cache
 
Poslednja izmena:
Iskreno, mislim da je taj reverse-HT skoro nemoguce izvesti, narocito tesko na hardverskom nivou na danasnjim FAT jezgrima. Mozda na nekom TLP jezgru poput Niagare ili na Cellu 😀 Razgovarao sam sa nekim ljudima koji se bave optimizacijama u matematici i objasnio sam im situaciju, sve u svemu to je tesko izvodljivo, a i pitanje koliki bi bio dobitak dok se oba jezgra sinhronizuju. Mozda ce to biti realno na buducim AMD-pvim procesorima koji ce imati shareovane dekodere, izvrsne jedinice itd, pa ce svako CPU jezgro moci da glumi jedan ili dva procesora, zahvaljujuci shareovanim resursima.
Primera radi, jedno CPU jezgro moze imati dva ALU pipeline-a, jedan shareovan 128-bitni FPU pipeline, L0 shareovan cache, dva puta po 3 dekodera, i svoj L2 cache koji koriste i ALU i FPU pipeline jedinice. Sinhronizacija takvog jezgra bi mogla da se zove reversibilni HT, pa se ono moze lako ponasati kao 6-way ili cak 8-way superskalarni chip ili kao dva 3-way chipa. To nas definitivno ceka u buducnosti, ali to sigurno nije u RevF, a ni u RevG, kao sto to nije ni K8L.
 
Poslednja izmena:
drfedja je napisao(la):
Iskreno, mislim da je taj reverse-HT skoro nemoguce izvesti, narocito tesko na hardverskom nivou na danasnjim FAT jezgrima. Mozda na nekom TLP jezgru poput Niagare ili na Cellu 😀 Razgovarao sam sa nekim ljudima koji se bave optimizacijama u matematici i objasnio sam im situaciju, sve u svemu to je tesko izvodljivo, a i pitanje koliki bi bio dobitak dok se oba jezgra sinhronizuju. Mozda ce to biti realno na buducim AMD-pvim procesorima koji ce imati shareovane dekodere, izvrsne jedinice itd, pa ce svako CPU jezgro moci da glumi jedan ili dva procesora, zahvaljujuci shareovanim resursima.
Primera radi, jedno CPU jezgro moze imati dva ALU pipeline-a, jedan shareovan 128-bitni FPU pipeline, L0 shareovan cache, dva puta po 3 dekodera, i svoj L2 cache koji koriste i ALU i FPU pipeline jedinice. Sinhronizacija takvog jezgra bi mogla da se zove reversibilni HT, pa se ono moze lako ponasati kao 6-way ili cak 8-way superskalarni chip ili kao dva 3-way chipa. To nas definitivno ceka u buducnosti, ali to sigurno nije u RevF, a ni u RevG, kao sto to nije ni K8L.



Fedja,znam kako izgleda i moram priznati da sam i ja sumnjicav u vezi cele price o clustered thread.Medjutim,stvar je porasla malo vise i posle par izvestaja i suskanja,izgleda da nesto postoji u RevF.Pitanje je samo sta i koliko efikasno to radi,nista vise.

Private mail from Theo to some guy on tomshardware forum:

Quote:
Theo Valich
to me

Hi K,

its not a rumour.

In fact, Cisco has been using the Reverse HT since 2004, for internworking two routers into one.

Theo
- Hide quoted text -
 
Poslednja izmena:
Pa glavna stvar bi bila deljen L0 kesh koje bi bilo glavna sprega izmedju registara dva odvojena ALU pipeline-a. Bez medjusobnih brzih veza tesko da bi radilo, barem tesko da bi radilo kako treba.
 
Ja mislim da bi organizacija takvog procesora morala barem ovako da izgleda.
http://www.chip-architect.com/news/hammer.jpg
U tom slucaju ne bi bio veliki problem naterati da jedan thread radi na ovakvom procesoru, koji moze da izigrava i single core.
Uostalom videcemo, AMD je definitivno imao u vidu ovakvo nesto, ali bih rekao da RevF to sigurno nije.

Ono sto mislim je to da AMD na zalost nema trenutno nikakvog keca u rukavu, a ono na sta ce morati da se izvlace je intertnost trzista, dok ne izbace ponovo bolji proizvod od Intela.

Ukoliko uvedu novu arhitekturu koja bi licila na ovo gore spomenuto, to bi bio jedan od najvecih arhitektutalnih pomaka koji su uradili od izlaska Athlona K7 na 500Mhz 1999. godine.

Ovo su bitne stavke koje je AMD doneo u X86 svet:
1. Alpha-like x86 arhitektura procesora - 1999.
2. Integrisani memorijski kontroler - Alpha EV7 like - 2003.
3. NUMA arhitektura - 2003.
4. x86-64 - 2003.

Cinjenica je da je do sada to sve vec negde postojalo, ali je to trebalo spustiti na nivo obicnih korisnika .
 
Poslednja izmena:
Negde sam ranije procitao da je taj "hammer" mozda trebao da bude otkazani(?) K9.To bi bio veliki pomak,mada sumnjam da ce se tako nesto desiti(ali nikad ne reci nikad,mi ipak imamo posla sa AMD-om,malim zelenim :d )

Nego back to topic,Turioni su na policama(kako javlja neko na Ace's forumu),TDP33W 🙂 za uslikani model. http://akiba.ascii24.com/akiba/news/2006/06/23/663057-000.html
 
Poslednja izmena:
ivanbo2003 je napisao(la):
Private mail from Theo to some guy on tomshardware forum:

Taj Teo pojma nema ili je pobrkao neke loncice...Pa pola rutera na planeti koriste Core multiplexing, tacnije OFDM iliti ortogonalnu modulaciju, koja predstavlja osnovu 802.11a i WiMax standarda i ko zna cega jos.
 
Moguce da je pomislio isto sto i Dean kada je "to"(ovoga puta u intelovom slucaju) povezao sa multiplexingom iz telekomunikacija.
Moracemo da sacekamo jos pa da vidimo.

PS Valjda Theo ima jos koji izvor osim tog objasnjenja :S:
 
Poslednja izmena:
ivanbo2003 je napisao(la):
Negde sam ranije procitao da je taj "hammer" mozda trebao da bude otkazani(?) K9.To bi bio veliki pomak,mada sumnjam da ce se tako nesto desiti(ali nikad ne reci nikad,mi ipak imamo posla sa AMD-om,malim zelenim :d )

Pravi Hammer i jeste bio otkazan! Originalni koncept Hammera je bio previse ambiciozan projekat za tadasnji AMD, pa su ostali na kompromisu tj. K8 koji danas imamo. Na njihovu srecu Netburst nije imao mnogo toga da pruzi pa je K8 bio dovoljan.
U poslednje tri godine nista nije izaslo iz AMD-a sem manjih tweak-ova mem. kontrolera na K8. Glupo bi bilo misliti da su AMD-ovi inzinjeri sedeli na rukama tri godine. Hector Ruiz je nedavno najavio novu mikroarhitekturu za 2008. koja je po svemu sudeci pravljena od nule (K7/K8 dizajn ima par "mac sa dve ostrice" resenja, pa bi bilo lepo da naprave nesto od nule). Period 2003-2008 fino odgovara vremenu koje mnogi smatraju da je potrebno za projektovanje potpuno novog procesora. Najverovatnije ce imati mnoge karakterisike otkazanog "pravog" Hammera, ali i po nesto novo - Cluster-based MultiTheading medju njima, ali ne onaj Clustered MT koji se sad vuce pod ovim RHT!

Cluster-based Multithreading je AMD "spomenuo" na 2005 Analyst Day pod naslovom "Multithreading done right". Ali da ne tupim previse evo sta kaze Hans de Vries o tome:
http://www.aceshardware.com/forums/read_post.jsp?id=120059007&forumid=1
http://www.aceshardware.com/forums/read_post.jsp?id=120059441&forumid=1
AMD ima dosta patenata koji podrzavaju ovu teoriju za post-K8L.

drfedja je napisao(la):
Ovo su bitne stavke koje je AMD doneo u X86 svet:
1. Alpha-like x86 arhitektura procesora - 1999.

To bas i nije tako kako izgleda. Athlon i Alpha EV6 lice samo spolja. Najociglednije EV6 bus koji su licencirali, karakteristican 64kb 2-way set L1 kes i 64 byte kes linije. (Mozda je donekle Alpha imao uticaja na ranu integer/fp podelu u Athlonu ali to je diskutabilno.) Dalje od ovoga slicnosti bas i nema. Mikroarhitekrura Alphe je usko povezana sa RISC arhitekturom i time jako tesko primenjiva na bilo kakav x86 procesor. Alpha je daleko superiorniji po pitanju branch prediction-a. EV6 je jos u dalekim devedesetima imao i potpuni memory reordering (load before load i load before store tj. ono sto intel zove memory disambiguation). Za integer pipe je primenjivao dupli register file i scheduler. Takodje je morao da primeni par dobrih prefetch algoritama jer je imao nesto dublji pipeline od RISC norme.
S druge strane Athlon je morao da bude izgradjen oko CISC ISA i mislim da su inzinjeri napravili pun pogodak na nekoliko polja, prvenstveno: MacroOP. Ceo Athlon je dizajniran oko macroop-ova i verujem da je taj rani pogodak omogucio i uspeh K8-ice. Evo i Intel je sad primenio isto to samo pod njihovim nazivom (microop fusion). Takodje, po jednoj studiji kombinacija macroop, trace cache i virtual machine (kad na Transmetinim procesorima) je najbolji nacin za implementaciju CISC ISA kao sto je x86 (okacio sam pdf u attach - jedan od autora je trenutno zaposlen u Intelu).
Pored toga Athlon je uveo i predecoding koji je od izuzetnog znacaja za x86 (i Core primenjuje jedan vid predecodinga ali jos nije jasno kakav). 7 od 12 pipeline faza K8-ice je zaduzeno za fetch-decode, pa je cak i jedan deo scheduling-a prebacen u pack-decode fazu, a execute je ostavljen sa izuzetno brzim schedule-execute loop-om, sto je opet odlicno za x86. O x87 optimizaciji Athlona ni ne moram trositi reci, mada ona gubi na znacaju.
 

Prilozi

Poslednja izmena:
Nadjoh, pa reko da okacim 🙂
Pastevao sam zato sto za site treba imati otvoren nalog!
Mozda ima neka novost, ako nema sorry!

AMD processor roadmap closing gap with Intel

Offering to license a crown jewel, Advanced Micro Devices Inc. (AMD) is opening its coherent HyperTransport processor interface to companies that want to build coprocessors for Opteron CPUs.

Access to the interface would allow other companies to design chip- or board-level products that can serve as closely coupled coprocessors to the host CPU, thereby improving system performance.

The announcement was just one of a dizzying array of disclosures AMD made at its semiannual technology day last week. The company shared aggressive technology and product plans, including a process road map intended to close the gap with Intel Corp.

Additional developments brought to light at the meeting include plans for a 65nm-based notebook processor and for a quad-core server processor that would open the door to multiprocessing systems with eight CPU chips, to deliver 32 program threads.

None of the announcements is likely to alter the competitive balance significantly between AMD and archrival Intel. But taken together, they reveal a company adamantly pursuing innovations and executing well on many fronts.

AMD's bid to license its coherent HyperTransport interface also demonstrates a growing confidence in its ability to expand the community of support for AMD's processor platforms.

"We are taking a very bold step by opening up our architecture. We know our competition will not do this," said Marty Seyer, senior vice president of the Commercial Business Segment at AMD.

The company detailed several new system platforms. A gaming-centric platform code-named 4X4 will extend AMD's commitment to deliver the highest-performance desktop systems, said Phil Hester, senior vice president and chief technology officer. Based on the dual-core 64bit AthlonFX processor and the Direct Connect architecture, the 4X4 can host one or two CPU sockets (up to four CPU cores) and support a pair of GPU-based graphics cards, such as the ATI Crossfire or Nvidia SLI, to deliver superior gaming performance, Hester said.

Three of the new platforms target the commercial segment. Torrenza will be the first Direct Connect computing platform to include the HTX coprocessor socket, which lets companies add customer-centric accelerators to improve multimedia, gaming, XML or floating-point applications, said Seyer. On motherboards with multiple CPU sockets, coprocessor chips can just drop into one of the CPU sockets. If a function becomes widely required, AMD could integrate it into the CPU or add it to the CPU package using multichip-packaging technology.

Focusing on security, virtualization and manageability, a platform code-named Trinity is said to provide better support for corporate IT managers. It will offer an open management partition to allow remote management of the platform as well as leverage the company's built-in Presidio (formerly Pacifica) security and virtualization technology, which breaks the tight coupling between hardware and software to allow a CPU to run multiple operating systems.

For low-cost client computing needs, a lightweight platform called Raiden, designed to deliver "just enough" computing for clients, promises to lower the overall cost of adding new clients to systems, Seyer said.

Unexpected move
The biggest surprise was AMD's decision to license coherent HyperTransport. The move could attract more silicon innovation around AMD-based computers and help the company prime a pipeline for future CPU features that would accelerate media, security, networking, XML, Java and more.

The noncoherent version of HyperTransport has long been an open, parallel chip-to-chip interconnect. But AMD has until today held tightly to its proprietary coherent version, which lets processors communicate directly, sharing cache data.

AMD will decide over the next 60 days whether it will make the technology available through the existing HyperTransport Consortium or through an adjunct group that would be created for the purpose. A set of APIs for HyperTransport coprocessors is also in development.

So far, only Cray and Newisys have licensed the technology for use with high-end interconnect chips in their own multiprocessing systems. But coprocessor vendors and OEMs that have expressed support for opening up the technology include IBM, Hewlett-Packard, Sun Microsystems and XML coprocessor startup Tarari.

AMD also disclosed work on a 65nm version of its dual-core Turion notebook CPU that is expected to debut in mid-2007. The company claims the device will require 40 to 60 percent less power than its current Turion CPUs when measured on an average range of applications. Enhancements come mainly in the form of a new memory controller and power-management technology geared for mobile systems.

High-end space
At the high end, AMD provided more details of a four-core processor for desktop and server systems. Slated for rollout in 2007, the CPU will sport four instead of three HyperTransport links, using version 3.0 of the technology and at least 2Mbytes of shared Level 3 cache (each core also packs 64Kbytes of L1 and 512Kbytes of L2 cache).

The cores will be enhanced to perform better branch prediction to reduce pipeline stalls, perform out-of-order load execution and perform 32byte instruction fetches. Instruction efficiency will also be improved, with up to four double-precision floating-point operations per cycle possible, along with dual 128bit loads per cycle. Internally, an enhanced crossbar will allow faster data movement within the chip. Dynamic independent core engagement will let the processor dynamically and individually adjust core frequencies for improved power efficiency.

The enhancements will let OEMs efficiently implement computers using eight chips without complex support logic, AMD said. Currently, optimal configurations for high-end AMD servers use four chips. The combination of more chips per system and more cores per chip pushes AMD deeper into high-end server territory, where it will compete with Intel's Itanium.

Chief executive Hector Ruiz said he wants AMD to capture 30 percent of the X86 server business. According to Gartner Group, the company currently has about 22 percent.

Overall, AMD says it still maintains a lead over Intel in performance per watt, though that lead may shrink as Intel begins to roll out its next-generation Core 2 Duo architecture over the next 12 months. Based on one AMD server comparison, the company could have as little as a 15 percent lead over Intel in system-level power consumption, much of it attributable to Intel's use of power-hungry, fully buffered DIMMs.

"We have the best X86 execution engine today, and we will have the best one next year," said Dirk Meyer, AMD's chief operating officer. "We have a lot of great engineers and they haven't been sleeping."
 
genuine je napisao(la):
nesto mi nije jasno... da li MicroOp znaci se kompleksne cisk instrukcije razbijaju na serije jednostavnijih risk .. posto nema stanse da intel to nije koristio...

MacroOp, ne MicroOp. Ima dosta konfuzije obzirom da Intel i AMD razlicito koriste neke termine. Mali rezime:

Intel MicroOp = AMD MicroOp - microop je jednostavna operacija koja se dobija razbijanjem kompleksnih x86 instrukcija.
Intel MicroOp fusion = AMD MacroOp - [ALU + Memory] operacije jedne kompleksne x86 operacije ostaju spojene i tako putuju niz pipeline - razdvajaju se pri scheduling.
Intel MacroOp = x86 kompleksna instrukcija - Intel ja obicnim kompleksnim ne-dekodiranim x86 instrukcijama dao nadimak MacroOp. Kazem nadimak, posto nije bilo potrebno imenovati nesto sto vec ima ime.
 
DeanXP je napisao(la):
Pravi Hammer i jeste bio otkazan! Originalni koncept Hammera je bio previse ambiciozan projekat za tadasnji AMD, pa su ostali na kompromisu tj. K8 koji danas imamo. Na njihovu srecu Netburst nije imao mnogo toga da pruzi pa je K8 bio dovoljan.
Pitanje za koga je bio ambiciozan taj projekat. Da li je bio ambiciozan za Intel i li AMD, ali ispalo je da dobijamo performanse na kasicicu.
Druga stvar, koja je bitna, koliko bi 2002. 2003. taj K8 zaista radio bolje od ovog, sa tadasnjim, ne-threadovanim softverom. Danas to ima smisla.
Inace, cisto sumnjam da su taj projekat bacili u kantu. Naredni procesori iz AMD-a ce izgledati bas tako, mozda i mocnije.
DeanXP je napisao(la):
U poslednje tri godine nista nije izaslo iz AMD-a sem manjih tweak-ova mem. kontrolera na K8. Glupo bi bilo misliti da su AMD-ovi inzinjeri sedeli na rukama tri godine. Hector Ruiz je nedavno najavio novu mikroarhitekturu za 2008. koja je po svemu sudeci pravljena od nule (K7/K8 dizajn ima par "mac sa dve ostrice" resenja, pa bi bilo lepo da naprave nesto od nule). Period 2003-2008 fino odgovara vremenu koje mnogi smatraju da je potrebno za projektovanje potpuno novog procesora. Najverovatnije ce imati mnoge karakterisike otkazanog "pravog" Hammera, ali i po nesto novo - Cluster-based MultiTheading medju njima, ali ne onaj Clustered MT koji se sad vuce pod ovim RHT!
Svakako se slazem sa tom konstatacijom i jedva cekam da vidim kako ce to cudo da izgleda i radi. K8L je samo upgrade u celoj prici.
DeanXP je napisao(la):
Cluster-based Multithreading je AMD "spomenuo" na 2005 Analyst Day pod naslovom "Multithreading done right". Ali da ne tupim previse evo sta kaze Hans de Vries o tome:
http://www.aceshardware.com/forums/read_post.jsp?id=120059007&forumid=1
http://www.aceshardware.com/forums/read_post.jsp?id=120059441&forumid=1
AMD ima dosta patenata koji podrzavaju ovu teoriju za post-K8L.
Svaka ti cast na informisanosti. Iznenadjujes me svaki dan sve vise.
:wave: Naravno u pozitivnom smislu.

DeanXP je napisao(la):
To bas i nije tako kako izgleda. Athlon i Alpha EV6 lice samo spolja. Najociglednije EV6 bus koji su licencirali, karakteristican 64kb 2-way set L1 kes i 64 byte kes linije. (Mozda je donekle Alpha imao uticaja na ranu integer/fp podelu u Athlonu ali to je diskutabilno.) Dalje od ovoga slicnosti bas i nema. Mikroarhitekrura Alphe je usko povezana sa RISC arhitekturom i time jako tesko primenjiva na bilo kakav x86 procesor. Alpha je daleko superiorniji po pitanju branch prediction-a. EV6 je jos u dalekim devedesetima imao i potpuni memory reordering (load before load i load before store tj. ono sto intel zove memory disambiguation). Za integer pipe je primenjivao dupli register file i scheduler. Takodje je morao da primeni par dobrih prefetch algoritama jer je imao nesto dublji pipeline od RISC norme.
Ja nisam rekao da je Athlon x86 Alpha, rekoh da je Alpha like. Implementacija takvih BP i prefetch funkcija u x86 svet je bila verovatno malo teži i skuplji posao, što naravno ne znači da neće tako biti. I memorijski kontroler je bio integrisan još 1991. godine u HP PA1701 RISC procesoru, što govori da mnoge napredne stvari dolaze baš iz RISC sveta.
DeanXP je napisao(la):
S druge strane Athlon je morao da bude izgradjen oko CISC ISA i mislim da su inzinjeri napravili pun pogodak na nekoliko polja, prvenstveno: MacroOP. Ceo Athlon je dizajniran oko macroop-ova i verujem da je taj rani pogodak omogucio i uspeh K8-ice. Evo i Intel je sad primenio isto to samo pod njihovim nazivom (microop fusion). Takodje, po jednoj studiji kombinacija macroop, trace cache i virtual machine (kad na Transmetinim procesorima) je najbolji nacin za implementaciju CISC ISA kao sto je x86 (okacio sam pdf u attach - jedan od autora je trenutno zaposlen u Intelu).
Pored toga Athlon je uveo i predecoding koji je od izuzetnog znacaja za x86 (i Core primenjuje jedan vid predecodinga ali jos nije jasno kakav). 7 od 12 pipeline faza K8-ice je zaduzeno za fetch-decode, pa je cak i jedan deo scheduling-a prebacen u pack-decode fazu, a execute je ostavljen sa izuzetno brzim schedule-execute loop-om, sto je opet odlicno za x86. O x87 optimizaciji Athlona ni ne moram trositi reci, mada ona gubi na znacaju.
Mnoga rešenja je Athlon nasledio i od svog prethodnika. Za x87 FPU bih rekao da je radjena po uzoru na Alphu EV6, sa tom razlikom što je CPU zasnovan na x86 ISA, što nosi svoja ograničenja.

x87 optimizacija gubi na značaju naročito u 64-bitnom Long modu! 😉
U buduće, x87 će ostati slepo crevo, evolutivni ostatak. SIMD performanse su postale izuzetno bitne, a da bi SIMD performanse bile dobre, potreban je veliki troughput, masivni i efikasni izvršni resursi, brz cache, brza memorija, niska latencija i još štošta.
 
Yoti je napisao(la):
Nadjoh, pa reko da okacim 🙂
Pastevao sam zato sto za site treba imati otvoren nalog!
Mozda ima neka novost, ako nema sorry!

AMD processor roadmap closing gap with Intel
Ono sto mogu da kazem je da mi nije jasno kako ce u narednih godinu dana da smanje "gap" u odnosu na Intel.
1. Desktop CPU od 1000$ je 15-20 % sporiji od Intelovog od 300$
2. Notebook CPU je takodje sporiji i ima jos manji performance per watt od Intelovog
3. Serverski CPU je takodje sporiji iako ima prednost u vidu HTT i NUMA arhitekture
4. Intelov najjeftiniji DC kosta 100$, a single core je mrtav, dok je AMD-ov najjeftiniji 300$
Jedini razlog sto jos nisam presao na Intel je to sto aktuelne ploce ne podrzavaju Conroe.

Sa 4x4 platformom ne znam sta su mislili da urade, ali 2x1K dolara za FX-eve je malo previse.

Ukoliko X2 3800+ ne bude kostao 100 evra na jesen, ili se ne bude desilo cudo poput RHT-a, AMD se nece izvuci tako jeftino. Jedino na sta mogu da se izvuku je inertnost trzista.
 
Fedja da bi bolje sagledao sliku ,moja najtoplija preporuka je ovaj thread:

http://www.amdzone.com/index.php?na...c&t=9174&sid=6d13cf0e1c6974e8ae34e1945b41ec0b

Posebno obrati paznju na postove korisnika scientia,covek ne da se razume,nemam reci.Thread ima 5 strana pa pogledaj samo njegove postove.Bukvalno sve o AMD i intel proizvodnim procesima,kako AMD moze da stigne intel ,kao i sta buduce godine donose.

PS Lik je na zone forumu od 2004. god. i skoro sve njegove prognoze su se ostvarile kad je u pitanju "veciti derbi" 🙂
 
drfedja je napisao(la):
Ono sto mogu da kazem je da mi nije jasno kako ce u narednih godinu dana da smanje "gap" u odnosu na Intel.
Mislim da ti posmatras problem iz krajnje uskog ugla i da si kao entuzijasta na prvom mestu svoje zakljucivanje bazirao na izvanrednim performansama Conroe-a. Niz ekonomsko-trzisnih aspekata je upleten u pricu oko procesora i osnovna premisa da neka kompanija "prezivi" jeste da prodaje procesore! A veruj mi AMD ne bi pravio 2 fabrike istovremeno (zida jednu u Njujorku i renovira drugu u Saksoniji), da nije uverio svoje investitore da ce prodavati procesore koje tamo bude proizvodio!
A da hoce, evo nagovestaja:
http://theinq.com/?article=32628
Prema tome, AMD racuna na trzisne mehanizme da odrze balans umesto brzinskih.
 
nedjo je u pravu amd prosto mora da prodaje vise default procesora da bi stigao intel u tome je i glavna fora a ne u oc-u i benchmarkovima tj. mora probati da profura svoje low i middle modele velikim kompanijama koje su recimo do sada furale sta ja znam dell/celeron masine kao radne stanice recimo zato je intel u tolikoj prednosti na trzistu a tu je i neverovatno skakutavo notebook trziste gde takodje amd mora da profura/poboljsa svoje proizvode zbog toga intel zbog svoje velicine moze glat da prodaje conroe za 300$ moci ce i amd da prodaje fx62 za istu kintu ali mora prvo imati veci udeo u low/middle segment trzistu tj. mnogo vecu prodaju "narodnih" i "office" masina
 
drfedja je napisao(la):
Ono sto mogu da kazem je da mi nije jasno kako ce u narednih godinu dana da smanje "gap" u odnosu na Intel.
1. Desktop CPU od 1000$ je 15-20 % sporiji od Intelovog od 300$

Tako sto ce taj desktop CPU da kosta 20% manje od 300$ (240$) kad se taj Intelov CPU pojavi 😀 :banana:
 
drfedja je napisao(la):
Pitanje za koga je bio ambiciozan taj projekat. Da li je bio ambiciozan za Intel i li AMD, ali ispalo je da dobijamo performanse na kasicicu.
Druga stvar, koja je bitna, koliko bi 2002. 2003. taj K8 zaista radio bolje od ovog, sa tadasnjim, ne-threadovanim softverom. Danas to ima smisla.
Inace, cisto sumnjam da su taj projekat bacili u kantu. Naredni procesori iz AMD-a ce izgledati bas tako, mozda i mocnije.

Nije AMD-u 2002-2003. bas bilo svejedno. Gubici su se gomilali kvartal za kvartalon, a imali su samo jedan RnD tim od kojeg je sve zavisilo. Verovatno su zakljucili da su x86-64, HyperTransport i int. mem. ctrl. dovoljni rizicni sami po sebi, pa nisu morali u igru ubaciti jos i novu mikroarhitekturu.
U svakom slucaju, Intel je sa Core malo razdrmao stvari i (nadam se) okoncao ovu trku puzeva zvanu Netburst vs. K8. Rat cena, ubrzano izbacivanje novih mikroarhitektura... marketing FUD... bar nam nece biti dosadno kao do sad 🙂

drfedja je napisao(la):
Svaka ti cast na informisanosti. Iznenadjujes me svaki dan sve vise.
:wave: Naravno u pozitivnom smislu.

Thx 🙂

drfedja je napisao(la):
x87 optimizacija gubi na značaju naročito u 64-bitnom Long modu! 😉
U buduće, x87 će ostati slepo crevo, evolutivni ostatak. SIMD performanse su postale izuzetno bitne, a da bi SIMD performanse bile dobre, potreban je veliki troughput, masivni i efikasni izvršni resursi, brz cache, brza memorija, niska latencija i još štošta.

Za SIMD je najvazniji bandwidth, a toga bar imaju u izobilju sa IMC i DDR2. Sad samo da prosire kes na 256-bita i SSE jedinice na 128-bita. Sa takvim potencijalom se s pravom mnogo ocekuje od K8L na FP polju - petaflop

@ivanbo2003: Ne znam koliko je AMDZone forum dobar izvor informacija. Tamo se vecina threadova zavrsava sa troll vs. fanboi prepucavanjima, bar koliko sam ja video.

Inace, lik mesa neke pojmove kao za tri-gate tranzistore i high-k:
scientia je napisao(la):
High-K dielectric is new. Previously, both Intel and AMD used low-K dielectrics. Intel is switching while AMD considers this a mistake and will stay with low-K.

Nema zasto AMD da smatra high-k dielektrike greskom, niti ce Intel low-k zameniti sa high-k, posto su oni komplenetrarni. Low-k dielektrici se trenutno koriste za izolaciju metalnih slojeva, dok high-k tek treba da se primeni za gate oxide. Intel je najavio high-k za post-45nm. High-k dielektrici ce biti obavezni u buducim procesima zbog odrzavanja kapaciteta gate oksida: C = k*Eo*S / d => Kako se smanjuje proizvodni proces tako se smanjuje povrsina kapije (S), a sa njom i kapacitet oksida (C). Do sada se za ovo moglo nadoknaditi smanjenjem debljine oksida (d), ali se polako dolazi do granice gde oksid ne moze biti tanji. Zbog toga je potrebno koristiri materijale sa vecom dielektricnom konstantom (k - u fizici je cesca oznaka Er). Silicijum oksid ima k = 3.9 - low-k <3.9, a high-k > 3.9.
 
DeanXP je napisao(la):
Nema zasto AMD da smatra high-k dielektrike greskom, niti ce Intel low-k zameniti sa high-k, posto su oni komplenetrarni. Low-k dielektrici se trenutno koriste za izolaciju metalnih slojeva, dok high-k tek treba da se primeni za gate oxide. Intel je najavio high-k za post-45nm. High-k dielektrici ce biti obavezni u buducim procesima zbog odrzavanja kapaciteta gate oksida: C = k*Eo*S / d => Kako se smanjuje proizvodni proces tako se smanjuje povrsina kapije (S), a sa njom i kapacitet oksida (C). Do sada se za ovo moglo nadoknaditi smanjenjem debljine oksida (d), ali se polako dolazi do granice gde oksid ne moze biti tanji. Zbog toga je potrebno koristiri materijale sa vecom dielektricnom konstantom (k - u fizici je cesca oznaka Er). Silicijum oksid ima k = 3.9 - low-k <3.9, a high-k > 3.9.

U pravu si za ovo,nisam toliko obracao paznju na fiziku koliko na time table stavri koje su obe firme unele u proizvodnju ili planiraju.Heck,fizika materijala je bila u drugoj godini 😀,zaboravilo se dosta.Svaka cast na znanju i informisanosti,mogao bi da skocis tamo i ispravis ga kad zabrlja 🙂.

PS Skoro svi forumi su dobili istu "boljku".Cak i famozni Ace's Hardw. na kojem ima "par" likova ,ponekad je smesno citati i pronaci nesto korisno u shumi flame-a.
 
Poslednja izmena:
Nedjo je napisao(la):
Mislim da ti posmatras problem iz krajnje uskog ugla i da si kao entuzijasta na prvom mestu svoje zakljucivanje bazirao na izvanrednim performansama Conroe-a. Niz ekonomsko-trzisnih aspekata je upleten u pricu oko procesora i osnovna premisa da neka kompanija "prezivi" jeste da prodaje procesore! A veruj mi AMD ne bi pravio 2 fabrike istovremeno (zida jednu u Njujorku i renovira drugu u Saksoniji), da nije uverio svoje investitore da ce prodavati procesore koje tamo bude proizvodio!
A da hoce, evo nagovestaja:
http://theinq.com/?article=32628
Prema tome, AMD racuna na trzisne mehanizme da odrze balans umesto brzinskih.
Pa dobro, ajde reci kako je AMD uspeo da osvoji trziste ? Sigurno ne sporijim i skupljim procesorima od Intelovih. Sada ispada da su AMD-ovi CPU*ovi sporiji i skuplji. Pa zar mislis da ce Intel sedeti skrstenih ruku u low end segmentu. Vec sada je diskutabilno da li je bolja kupovina Sempron za AM2 ili Celeron Cedar Mill.
Ako vec imaju dobar proizvod, lako ce od njega da naprave i procesore za "narodne mase" .
To sto otvaraju nove fabrike ne znaci nista, mogu i da puknu zbog toga, otprilike kao sto je prso i 3dfx . Zaista ne vidim sta ce oni da ponude trzistu i u Low End segmentu, narocito kada Intel izbaci Core2 Solo.
Usput, ako su napravili dil sa Dell-om, ne znaci da ce sad Dell da odustane od Intela i da ce prodavati notebookove sa Turionom, desktope sa Sempronom itd....
Ono na sta AMD racuna je Torrenza i HTT kao otvoren standard na serverskom planu. Veruj mi da niko u skorijoj buducnosti u value masinama nece korstiti prednosti Torrenza platforme.

I dalje mi nije jasno sa kojim ce to proizvodom AMD da zadrzi kupce. Mozda ja ne kapiram bas najbolje principe trzisne ekonomije u koju se ne razumem, ali jednostavno gledano, ne vidim da mogu da izadju na kraj sa Intelom, osim ako nemaju bar jednako jaku platformu.

Sto se vecine entuzijasta tice, mislim da ce sledeca godina definitivno biti u znaku Intela.
 
samo jedno pitanjce za iskusne.... Koliko je realisticno ocekivati dobitke sa 6-way i 8-way procesorima... ?

pozivam se na rezultate koje je 1991 uradio Johnson
 
jel vazi C = k*Eo*S / d u nano svetu?
 
Nazad
Vrh Dno