Fermi is Nvidia's DirectX 11

kovacm · 29.09.2009

colt je napisao(la):
... + dedicated jedinica za teksturisanje na inter-core prstenu, jer jednostavno, to nije dovoljno brzo za implementirati softverski, makar to bilo i na mighty Cell-u.

da, ovo je bilo poznato i za vreme razvoja PS3 - da Cell sam neće moći da radi GPU posao iako je tako prvo bilo zamišljeno...

elem, jel se zna nešto više o datumu izlaska Larrabee-a ?

mislim da sam već pitao ali sam zaboravio... da li svaki core u Larrabee može da pristupi bilo kojem delu RAMa ili su Core-ovi ograničeni na neki svoj lokalni RAM kao kod Cell-a?

Ace Rimmer · 29.09.2009

Nešto pričaju da će lite varijanta biti integruša u novim procesorima. Možda bi to bio prvi pojavni oblik.

ikonoklast · 29.09.2009

kovacm je napisao(la):
mislim da sam već pitao ali sam zaboravio... da li svaki core u Larrabee može da pristupi bilo kojem delu RAMa ili su Core-ovi ograničeni na neki svoj lokalni RAM kao kod Cell-a?

Da si otvorio PDF sto sam linkovao, znao bi.

A coherent on-die 2nd level cache allows efficient inter-processor communication and high-bandwidth local data access by CPU cores

This paper describes a highly parallel architecture that makes the rendering pipeline completely programmable. The Larrabee architecture is based on in-order CPU cores that run an extended version of the x86 instruction set, including wide vector processing operations and some specialized scalar instructions. Figure 1 shows a schematic illustration of the architecture. The cores each access their own subset of a coherent L2 cache to provide high-bandwidth L2 cache access from each core and to simplify data sharing and synchronization.

I ovo:
http://en.wikipedia.org/wiki/Larrabee_(GPU)#Comparison_with_the_Cell_Broadband_Engine

kovacm · 29.09.2009

colt je napisao(la):
Da si otvorio PDF sto sam linkovao, znao bi.

I ovo:
http://en.wikipedia.org/wiki/Larrabee_(GPU)#Comparison_with_the_Cell_Broadband_Engine

sad sam se setio. i audio je pricao o ovome... 10x.

Paradigma · 29.09.2009

Da prekrupim za neupućene:

Larrabee arhitektura se oslanja na model memorijske hijerarhije, a to znači da jezgro ima svoj L2 cache od 256KB kojem pristupa sa najmanjim kašnjenjem, zatim može da pristupi i ostalim L2 segmentima preko prstenaste magistrale koja povezuje sve L2 segmente uz nešto veće kašnjenje i na kraju ukoliko se na podatak čeka da stigne iz sistemske memorije sa maksimalnim kašnjenjem. Dakle svaki program koji se izvršava na Larrabee arhitekturi može da pristupi linearno svoj raspoloživoj memoriji poput procesora opšte namene.

kovacm · 29.09.2009

i dakle ne mozes da kontrolises sta je u L2 cache memoriji. Audio je spominjao da postoje naredbe kojima možeš da koliko-toliko kontrolišeš ovo....

Paradigma · 29.09.2009

kovacm je napisao(la):
i dakle ne mozes da kontrolises sta je u L2 cache memoriji. Audio je spominjao da postoje naredbe kojima možeš da koliko-toliko kontrolišeš ovo....

ova rečenica:

"all on-chip and off-chip memories are under automatically-managed coherent cache hierarchy"

znači da ne utičeš na sadržaj u memorijskoj hijerarhiji ali je to ustupak koji se negde mora platiti.

Doduše to ne znači da se nekim tehnikama (trikovima) ne može posredno uticati na stanje L2 keša.

nex999 · 30.09.2009

NVIDIA GT300 to have over 3 billion transistors

Rys from Beyond3D has published a blurred screenshot of a diagram of the NVIDIA GT300 architecture. The chip is named GF100, which appears to be yet another codename for the GPU we know as GT300. The "GF" possibly stands for "GeForce Fermi".

VR Zone grabbed their magnifying glass and published some of the info they could uncover from the slide. One of the details they've unearthed is that the chip has over 3 billion transistors, it's not very readable but it could be 3.2 billion transistors.

At the bottom of the blurred diagram are what looks like 6 MCs, which confirms the 384-bit memory interface we reported earlier. Right above the MC we have a big chunk of ROPs, though it just looks like one big, black blur - which might suggest too many ROPs than can be differentiated by large white spaces.

Things get particularly tricky once we get to the processing units. One of these GF100 SIMD/MIMD units seems quite different from GT200's SIMD units, as shown here in Beyond3D's previous GT200 diagram. Replacing the 24 "shader cores" in GT200 are what we can only suggest as "between 16 and 20 grey dots" and "4 blue stars". Back to the diagram itself, there are 16 of these units. Once the significance of these "grey dots" and "blue stars" are revealed, we will have a major portion of the specifications.

http://vr-zone.com/articles/-rumour-nvidia-gt300-architecture-details-revealed/7763.html?doc=7763

Dakle, cekamo da saznamo sta su sive tackice i plave zvezdice...

Borat · 30.09.2009

nex999 je napisao(la):
NVIDIA GT300 to have over 3 billion transistors

http://vr-zone.com/articles/-rumour-nvidia-gt300-architecture-details-revealed/7763.html?doc=7763

Dakle, cekamo da saznamo sta su sive tackice i plave zvezdice...

Да се погоди, оно што је сигурно је да ГФ100 је чудовиште - паковање у више од 3 милијарде транзистора! Cudoviste

Rapture · 30.09.2009

Kad ce vec biti tolka ala od karte, hoce li moci sama da potera phyzix u sadasnjim igrama koje traze dodatnu kartu?

zerbah · 30.09.2009

Hm, ne znam koliko si upucen u to kako radi PhysX u sadashnjim igrama - do sada najzahtevnija PhysX igra, Batman Arkham Asylum, moze komotno da se igra sa PhysX na High u 1680x1050 sa jednom GTS250 (pada framerate retko nize 30), a sa GTX260 216 radi glatko i u 1920x1200. Kapiram da ce na GT300 raditi odlichno u 2560x1600 rezoluciji

Шабанија · 30.09.2009

kapiraj da ćeš moći da kupiš i 4 x gts250 za gt300

mislim da ni 1% foruma se ne igra u toj rezoluciji. a ni ne razmišlja o tome.

mcrazy · 30.09.2009

zerbah je napisao(la):
Hm, ne znam koliko si upucen u to kako radi PhysX u sadashnjim igrama - do sada najzahtevnija PhysX igra, Batman Arkham Asylum, moze komotno da se igra sa PhysX na High u 1680x1050 sa jednom GTS250 (pada framerate retko nize 30), a sa GTX260 216 radi glatko i u 1920x1200. Kapiram da ce na GT300 raditi odlichno u 2560x1600 rezoluciji

Ja ne znam kako i sta ali ja ne mogu sa gtx280 (700mhz) da igram sa sve na maximumu. Naravno, vecinu vremena nisam imao problema ali dva fajta sa scarecrow-om su bila slideshow. Rezolucija 1680x1050, o 19x12 ne bih ni da pomisljam...

nex999 · 30.09.2009

Kod mene radi najnormalnije, na 8800GT, pa jos i sa 2xAA i AF na maks

Doduse to je 1280*1024, ali ako nekad budem presao na GT300 i on ne bude mogao da izgura physx kao sto izgleda ne moze, eto razloga da zadrzim ovaj svemocni 8800GT da radi fiziku

starac · 30.09.2009

3.0 billion transistors
40nm TSMC
384-bit memory interface
512 shader cores [renamed into CUDA Cores]
32 CUDA cores per Shader Cluster
1MB L1 cache memory [divided into 16KB Cache - Shared Memory]
768KB L2 unified cache memory
Up to 6GB GDDR5 memory
Half Speed IEEE 754 Double Precision

http://www.brightsideofnews.com/new...ure-unveiled-512-cores2c-up-to-6gb-gddr5.aspx

A GPU supports C++ natively?
Ferni architecture natively supports C [CUDA], C++, DirectCompute, DirectX 11, Fortran, OpenCL, OpenGL 3.1 and OpenGL 3.2. Now, you've read that correctly - Ferni comes with a support for native execution of C++. For the first time in history, a GPU can run C++ code with no major issues or performance penalties and when you add Fortran or C to that, it is easy to see that GPGPU-wise, nVidia did a huge job.

,)

borab · 30.09.2009

Koje napajanje ce biti potrebno za recimo:
I7 + Gt300 ? ~1KW.

yooyo · 30.09.2009

Ako je ovo tacno, NVidia je ugurala ARM jezgro u GPU!

Borat · 30.09.2009

borab je napisao(la):
Koje napajanje ce biti potrebno za recimo:
I7 + Gt300 ? ~1KW.

Ja sam uzeo novo moze da trosi kolko oce

Ovaj GPU ce biti Ludilo ako je sve ovo istina

Ace Rimmer · 30.09.2009

yooyo je napisao(la):
Ako je ovo tacno, NVidia je ugurala ARM jezgro u GPU!

može pojašnjenje za laike

Rapture · 30.09.2009

starac je napisao(la):
Up to 6GB GDDR5 memory

:zgran: , dal su oni normalni :S:.......

Ace Rimmer · 30.09.2009

Pa sadašnji Tesla ima 4Gb, a DDR5 više nije egzotika

.

zeljko · 30.09.2009

pa mora malo da dizu prasinu jer je 5xxx na trzistu

mislim da cemo veoma brzo videti leaked testove.. ci uspeju da skockaju zglavan driver ...

Ace Rimmer · 30.09.2009

Danas bi navodno trebala biti predstavljena kartica ... vizualno.

Borat · 30.09.2009

Ace Rimmer je napisao(la):
Danas bi navodno trebala biti predstavljena kartica ... vizualno.

Nvidia će predstaviti svoju DirectX 11 karticu koju smo nazivali GT300, a koja je sada poznata po internom imenu Fermi. Hardver je spreman i više detalja ćemo imati sutra. Očekujemo da će Nvidijin izvršni direktor Jensen Huang predstaviti karticu na GTC-u, koji po centralnoevropskom vremenu počinje u deset navečer.

Fermi bi trebala biti veoma brza kartica kada su u pitanju DirectX 11 i starije igre. Ima dosta keš memorije i podržava instrukcije koje su ranije bile samo za CPU i mnogi ljudi vjeruju da je u pitanju hibrid između grafičke karte i CPU-a. To je možda i Nvidijin plan za budućnost.

Znat ćemo više nakon današnjeg predstavljanja, koje sigurno možemo potvrditi. To je reakcija koju smo svi očekivali i koja bi mogla zasjeniti uspjeh Radeon HD 5870 serije.

IZVOR(Dobri stari Fuad):http://www.itx.ba/index.php?option=com_content&task=view&id=11210&Itemid=1

yooyo · 30.09.2009

Ako moze da kompajlira i izvrsava C++ code onda taj GPU ima sve osobine pravog CPU-a. To znaci stack, pristup celokupnoj memoriji, zastita procesa, itd.. Obzirom da NVidia nema licencu za x86 set, jedino sto mogu da urade je da izmisle svoj set instrukcija ili da iskoriste ARM. Ako bi stavili ARM onda ogroman broj programa bi mogao da se vrti na GPU. Imali bi kompajler (gcc) kojim bi pogurali celu stvar.

E sad koliko ARM jezgara moze da bude unutra? Jedno ili vise? Mozda ima samo jedno ARM jezgro koje diriguje Stream procesorima i omogucava da se veliki deo posla prebaci na GPU. Citavi delovi igre bi se mogli izvrsavati kompletno na GPU... generisanje modela, logika igre, AI, .. mnogo toga.

Takodje, otvara vrata za custom rendering engine, bez upotrebe OpenGL-a ili D3D-a... prakticno ono sto je intel hteo da uradi sa Larrabee.

Sa druge strane, mozda su samo napravili novu CUDU koja ima osobine C++-a i omogucava kompleksnije strukture, virtuelne funkcije, itd.. a da sam GPU jos nije na nivou pravog CPU-a ali ima dosta toga slicnog.

Ace Rimmer · 30.09.2009

Da li je moguće da su se poslužili nekim zaobilazim rješenjem, slično kao JCUDA?
http://www.cs.rice.edu/~vs3/PDF/Yan-Grossman-Sarkar-Europar-2009.pdf
http://www.jcuda.org/

nex999 · 30.09.2009

Nastavak...

[YOUTUBE]<object width="560" height="340"><param name="movie" value="http://www.youtube.com/v/qStm5xoDHFU&hl=en&fs=1&"></param><param name="allowFullScreen" value="true"></param><param name="allowscriptaccess" value="always"></param><embed src="http://www.youtube.com/v/qStm5xoDHFU&hl=en&fs=1&" type="application/x-shockwave-flash" allowscriptaccess="always" allowfullscreen="true" width="560" height="340"></embed></object>[/YOUTUBE]

http://www.nvidia.com/object/gpu_technology_conference.html#livewebcast

DAS · 30.09.2009

Jel ovo GPU ili sta?

Zekaleon · 30.09.2009

Ne znam, sumnjivo je to sto onaj na tabli crta neke spermatozoide, kao da zele nesto da poruce konkurenciji :-devil-:
Hoce li sutra biti neka demonstracija performansi?

DAS · 30.09.2009

http://techreport.com/articles.x/17670

http://www.anandtech.com/video/showdoc.aspx?i=3651&p=1

I asked two people at NVIDIA why Fermi is late; NVIDIA's VP of Product Marketing, Ujesh Desai and NVIDIA's VP of GPU Engineering, Jonah Alben. Ujesh responded: because designing GPUs this big is "fucking hard".

Double precision floating point (FP64) performance is improved tremendously. Peak 64-bit FP execution rate is now 1/2 of 32-bit FP, it used to be 1/8 (AMD's is 1/5). Wow.

Fermi is Nvidia's DirectX 11

Čuven

Slavan

Čuven

Čuven

Čuven

Čuven

Čuven

Moderator

Banned

Slavan

Slavan

Banned

Slavan

Moderator

Čuven

Čuven

Čuven

Banned

Slavan

Slavan

Slavan

Banned

Slavan

Banned

Čuven

Slavan

Moderator

Slavan

Slavan

Slavan