K10 je unapredjen na svim poljima, a narocito po pitanju SSE. Unapredjivanje x87 bi bilo rasipanje resursa, a pitanje je koliko je moguce ubrzati ovaj legacy nacin rada sa floating point brojevima.
K10 pored dupliranog FP bandwidth-a ima niz poboljsanja koja ce uticati i na brzinu rada sa intidzerima. Jednostavno, ako hoces da napravis brz CPU koji je brz za jednu primenu, moras da se resis nekih uskih grla.
Sto se tice ALU jedinica, one kod K8 uopste nisu bile spore, a kod K10 su jos doradjene, no to nije bilo usko grlo. Fetch bandwidth je dupliran, cache bandwidth, prefetch ide direktno u L1 sto je brze nekoliko puta nego L2, branch predictor je poprilicno doradjen, rad sa stekom je kao kod i C2D, hardverski kontrolisan, masa instrukcija je sada hardwired sto znaci da imaju poprilicno nizu latenciju, memorijski kontroler je doradjen, medjujezgarna komunikacija je daleko bolja, datapath ka memorijskom kontroleru je sada 128-bit. Prakticno sve interne magistrale i 'load-i' su duplirani u odnosu na K8.
Tu je i AMD-ova implementacija super shuffle engine-a, fast radix-a, memory disambiguation-a. Dakle, nema sumnje bar po papirima, da ce K10 biti zverka, samo je pitanje na kolikom taktu.
Sto se mojih procena tice, K10 bi u vektorskim operacijama mogao da bude i 2x brzi od K8 na istom taktu, u realnim aplikacijama, C2D je oko 40%.
U integer operacijama bi mogao da bude brzi oko 20-40%, a u stvarima koje se ne obracaju memoriji preterano bi mogao da ostane na slicnom nivou, a takvih je malo.
K10 ima FPU daleko mocniji nego sto to ima K8 u odnosu na K7. K10 sigurno nece biti netburst, narocito ako posmatras IPC broj.
Sto se tice igara, verovatno da ce K10 kidati igre, zbog prefetchera i zbog disambiguation-a i zbog novog memory kontrolera, a narocito ce biti dobar u server workloadu zbog shareovanog L3 kesha, sto je jako dobro i za multisocket masine.
Prema tome, jako bi me iznenadilo da K10 bude u bilo cemu sporiji od K8 na istom taktu.
Razlika u performansama ce biti u proseku 30-40% klok za klok u odnosu na Windsor jezgro.
Jedno od uskih grla kod K8 je L2 prefetch, a zatim L2->L1 kopiranje koje zbog exclusive kesh arhitekture ima dodatne cikluse zbog victim buffer-a, relativno mali bandwidth jer bi implementacija sireg bila skupa i komplikovana.
Sve u svemu tu ima dosta stvari koje bi trebale da cine da ovaj CPU radi odlicno kada je u pitanju IPC broj, samo je pitanje da li je to dovoljno da parira 3.3 Ghz Penryn-u. Conroe-u do 3 Ghz ce verovatno moci da parira.