Procitaj ovo boldovano, kontradiktorno je 🙂
Kazes da GTX 780Ti i GTX 980 Ti imaju skoro isti broj CUDA jezgara, a posle kazes da su svi tranzistori otisli u FP32 performanse. A CUDA jezgra i JESU FP32 performanse.
GTX 780Ti ima ~5.1 FP32 compute power a GTX 980 Ti oko 6.1 (to je sa vec uracunatim vecim klokom GTX 980Ti), znaci sirova FP32 snaga je povecana za ~20% ali perfomanse za 40%. Sto znaci da tvoja prica ne pije vodu, ocigledno je ulozeno dosta u redizajn cipa i optimizaciju. GK110 je tezak 7.1 m tranzistora a GM200 8 m. Prvi ima 2880 procesora a drugi 3072. Dakle sa samo 12% povecanja u broju tranzistora i 7% povecanja shader procesora, uspeli su da podignu performanse za skoro 50%. Kroz redizajn shejdera, koji rade em efikasnije em na vecim klokovima, a trose manje.
Zakljucak je da je FP32 sirova snaga nesto povecana ali performanse znatno vise a potrosnja smanjena a da to nema veze sa DP logikom na samom chipu.
Sta bi bilo da GTX 980 ima 1/8 DP? Nista, bio bi nesto veci chip ali u igrama iste performase kao i sada 😉
Umem ja ponekad da budem konfuzan i kontradiktoran
😛
Elem, 980ti i 780ti imaju maltene identican broj CUDA jezgara za koju sam siguran da su imala minimalnu optimizaciju kao sto je i AMD imao sa GCNom
🙂
Razlika u performansama je u sledece tri stavke kod
OVE DVE KARTE, ne uporedjujemo punokrvna jezgra vec nihove ekvivalente:
980ti vs 780ti
- 1,000 MHz vs 875 MHz razlika 15%
- 96 GPixel/s vs 52.5 GPixel/s razlika 85%
- 96 ROP vs 48 ROP razlika 2x
E sad oni su naravno povecali povrsinu cipa sa GM200 za 9% sto i nije previse da napravi razliku u brzini od 40%
🙂 U sledecoj tabeli lezi resenje te misterije.
GM200 | 601mm2 | FP64=1/32
GK110 | 551mm2 | FP64=1/3 kod 780ti je to oko 1/24 koliko videh
🙂
Zakljucak ove price je sledeci:
NVIDIA nije nista drugo uradila nego povecala GK110 za 9%, obogaljila FP64 performanse (35%) i sve te slobodne tranzistore iskoristila da napumpa ROP jedinice, i dobije prostor za vecu frekvenciju i broj CUDA jezgara i manju potrosnju jer je FP64 zderac energije u odnosu na FP32. Odatle ta ultra magicna optimizacija cipa i dizanje u nebesa NVIDIA kompanije kao gurua GPU sveta. Naravno za to im je trebalo 4 generacije nakon Fermija. 🙂
Evo i jednog clanka sa nama omiljenog sajta o ovoj temi
http://wccftech.com/nvidia-gm200-gpu-fp64-performance/
E sad malo o crvenima AMD je sa FIJI X cipom koji je po glasinama ~595mm2 prestigla performanse cipa koji je
VECI i koji ima
DUPLO manje FP64 performanse. E sad osvrnuvsi se na pricu o prostoru i tranzistorima koje FP64 zauzima slozices se da je AMD uradio znatno bolji posao sa projektovanjem arhitekture, ali je zato po obicaju pravio stalne marketinske promasaje, i na momente zanemarivao sitne softverske probleme koji su pravili probleme njihovim kupcima. Odatle cela fama da je NVIDIA bolja
😛
Toliko od mene, lakse je forumasiti od kuce nego sa posla
😛
P.S. Jos samo da napomenem da ce R9 NANO da se takmici sa 980 na istom proizvodnom procesu a karta ce ocigledno imati najbolji PERF/WAT u zadnjih nekoliko genracija
😀