Šta je novo?

nVidia u problemima...

Status
Zatvorena za pisanje odgovora.
ne gresis, ATI je morao da smisli nesto svoje. Tih 800SP kolko ja znam nije 800SP jer oni racunaju i one pod korake ili kako se vec zove, sad vec lupam bzvz. Uglavnom racunaju kolko moze ukupno instrukcija po shaderu da se odradi ili tako nesto. Kao kad bi nvidia pomnozila recimo tih 240 sa 2, nesto na taj fazon. U pocetku je pola pod-koraka (nek neko napise kako se to tacno zove) na r600 zvrjalo u prazno jer je bilo programirano tako da se iskoriste samo 2...

Ovo je sve vecinom pogresno napisano, nek neko ko zna tacno napise ponovo 😛

edit: NEdjo, nemoj me natovariti vec napisi tacno sta je i kako, znam da znas 😉 Znao sam i ja al sam pozaboravljao vremenom :S:
 
Poslednja izmena:
Postoje ali nije isto npr. programirati za ATI-evih 800SP-a i nVidia-nih 240. Barem ja tako razmisljam, neka me neko iskusniji (yooyo ili genuine) ispravi ako gresim.

trebao bi da je isto! 😉 :d

problem nastaje ako jedna od te dve kartice ima problema sa izvrasavanjem koda koji je napisan pomocu nekog najmanjeg zejednickog imenitelja kad su Pixel/Vertex shaderi u pitanju (GLSL ili M$ HSLS).
 
Poslednja izmena:
HD48x0 bi trebalo da ima 160 x 5 = 800 SP-a...
 
ja mislim da je nV opila slava, nije se ni nadala ovome udarcu ATI-a
 
ne gresis, ATI je morao da smisli nesto svoje. Tih 800SP kolko ja znam nije 800SP jer oni racunaju i one pod korake ili kako se vec zove, sad vec lupam bzvz. Uglavnom racunaju kolko moze ukupno instrukcija po shaderu da se odradi ili tako nesto. Kao kad bi nvidia pomnozila recimo tih 240 sa 2, nesto na taj fazon. U pocetku je pola pod-koraka (nek neko napise kako se to tacno zove) na r600 zvrjalo u prazno jer je bilo programirano tako da se iskoriste samo 2...

Ovo je sve vecinom pogresno napisano, nek neko ko zna tacno napise ponovo 😛

edit: NEdjo, nemoj me natovariti vec napisi tacno sta je i kako, znam da znas 😉 Znao sam i ja al sam pozaboravljao vremenom :S:

izvukao si se sa ovom zadnjom recenicom, vec sam krenuo da te tovarim. :d
LM, nisi u pravu tih 800SP-ova je zaista 800, bas kao sto je 240 SP-ova kod 'vidije, zaista 240. 😉
 
Poslednja izmena:
A ono 5 way shaderi? Jedna prica od Nedje jedna od byMaxa.
 
Nije to bas tako jednostavno kao sto Nedjo kaze.
Tih 800 shadera su grupisani u klasterima po 5,tako da zapravo postoji 160 5-way shadera. Da bi bili uposleni svih 5 procesora u okviru tog jednog 5-way,instrukcije moraju biti nezavisne jedna od druge u shader programu.Ako su zavisne onda ce neke jedinice cekati na rezultat onih drugih i za to vreme nece raditi nista.Drugi nacin je da se instrukcije malo prepakuju kako bi se shaderi optimalnije iskoristili.Znaci kod Ati-ja nikad ne rade svih 5 procesora u okviru jednog shadera,a u najgorem slucaju radi samo jedna(pomalo paradoksalno imenu arhitekture-USA).Kod nVidia-e,sa druge strane,uvek radi svih 240 shadera,i to na duplo vecoj frekvenciji.To je razlog sto nVidia sa svojih 933 GFLOPS-a izvlaci vise nego Ati sa 1,2 TFLOPS-a.
Evo kako to slikovito izgleda:

ilp.png


Treba jos naglasiti da je jedna od tih 5 jedinica u okviru streaming procesora(kako ga nazivaju na Anandu) SFU(special function unit) koja obavlja transcedentalne funkcije..E sad Ati kaze da ta SFU moze da radi i shadere kao i ostale 4,ali to ostaje pitanje.S druge strane nVidia za ove funkcije ima posebne SFU jedinice i postoji 2 na svaki streamin multiprocesor(grupa od 8 shadera).nVidia kaze da ove jedinice ponekad mogu da pomognu i u izvrsavanju shader programa.
Razlike su jos i u grupisanju tih shadera,kao i u tome gde se nalaze razne kesh memorije,itd.
 
tih 800 SP-ova su upravo to - Streaming processors, bas kao sto su onih 240 SP-ova kod 'vidije 240 Streaming Procssora... mojne da mesate Shader processore sa Streaming Processorima!

ovoo sto je DAS napisao kada i koliko SP-ova radi NIJE TACNO!
 
Mora biti da je nešto od toga ipak tačno. Kako inače objasniti da je GT200 ipak primetno brži od RV770 iako ima manju teoretsku računsku moć?
 
Nedjo,a sta fali DAS-ovom objasnjenju?
 
Nije to bas tako jednostavno kao sto Nedjo kaze.
Tih 800 shadera su grupisani u klasterima po 5,tako da zapravo postoji 160 5-way shadera.
Nije 800 Shader, vec 800 Streaming processora!
Da bi bili uposleni svih 5 procesora u okviru tog jednog 5-way,instrukcije moraju biti nezavisne jedna od druge u shader programu.
Netacno!
Ako su zavisne onda ce neke jedinice cekati na rezultat onih drugih i za to vreme nece raditi nista.
netacno!
Drugi nacin je da se instrukcije malo prepakuju kako bi se shaderi optimalnije iskoristili.Znaci kod Ati-ja nikad ne rade svih 5 procesora u okviru jednog shadera,a u najgorem slucaju radi samo jedna(pomalo paradoksalno imenu arhitekture-USA).
Netacno!
Kod nVidia-e,sa druge strane,uvek radi svih 240 shadera,i to na duplo vecoj frekvenciji.To je razlog sto nVidia sa svojih 933 GFLOPS-a izvlaci vise nego Ati sa 1,2 TFLOPS-a.
NV je brza na mestima na kojima je brza jer je kod optimizovan za NV arhitekturu, odnosno ne iskoriscava prednosti ATI arhitekture. Sami FLOPSI nemaju preterane veze sa DX/OGL kodom
E sad Ati kaze da ta SFU moze da radi i shadere kao i ostale 4,ali to ostaje pitanje.
Nije pitanje, vec cinjenica!
S druge strane nVidia za ove funkcije ima posebne SFU jedinice i postoji 2 na svaki streamin multiprocesor(grupa od 8 shadera).nVidia kaze da ove jedinice ponekad mogu da pomognu i u izvrsavanju shader programa.
otkud ti to da NV ima dve posebne "jedinice" za izvrsavanje transcedentalnih funkcija???
Razlike su jos i u grupisanju tih shadera,kao i u tome gde se nalaze razne kesh memorije,itd.
Ajd to je tacno!

Eto ti odgovor genuine!

A sad je bilo dosta price o ATIju u NV threadu!
 
Poslednja izmena:
Nedjo,a sta fali DAS-ovom objasnjenju?

To što tvrdi da nikada ne radi svih 5 Stream procesora u okviru Shader procesora.

Takođe, SFU jedinica i kod nVidie i ATIa izvršava shader operacije, kako god da okreneš, jer se na njima računaju sin, cos, i ostala čuda. Ne znam kako stoje stvari kod nVidie, ali taj 5. SP kod ATI-ja pored tih transcedentalnih funkcija može sigurno i da vrši sabiranje i množenje. Dakle, to nije ni pod kakvim znakom pitanja. 😉

Edit:
Preteče me Neđo. 🙂
 
Poslednja izmena:
Ajde nedjo malo detalja o tim streaming procesorima... u okviru shader procesora... jel oni rade nad istim threadom ili izvrsavaju "nezavisne" threadove?
Koliko ja vidim na ovoj slici oni 5 njih tj. 1 shader proc izvrsava jedan thread, tako da postoje besposleni sp-ovi. Sto znaci dalje da u idealnom slucaju kada rade svi ati ima 1.2TFlopsa a u realnom, kada postoje medjuzavisnosti u toku onda to drasticno padne
 
Poslednja izmena:
Ima tu neke istine. ne rade uvek svih 800, a zasto to najbolje zna ATI. Bice da treba doterivati drajvere, ali o iskoriscenju svih 800 uvek i svuda nema govora. Ako koristi i 50% u proseku odlicno je. Naravno prosek je statistika, a statiskika je k*rva, tako da moze da "izuva", a moze i da prodje k'o bosa po trnju. evidentno je da u shader intenzivnim igrama (Assassin's Creed, COD4, Oblivion...) radi odlicno, dok u onim jednostavnijim, a samim tim manje pogodnim za "paralelizam", dolazi do losijeg koriscenja svih 800 i nesto manje konacne brzine. Sad cu bas banalizovati problem i ako nema veze sa ovim sto cu napisati, ali je slikovito. Zamislite malog Djokicu kako uzima kemencice, po 5 komada i baca ih sa 3 metara u bure, a sa druge strane zamislite Pericu, Jovicu i npr. Ivicu kako uzimaju po jedan kamencic i bacaju ga u to isto bure. Djokica baca i 2-3 upadaju (ponekad samo jedan, a ponekad i svih 5), jer se rasipaju, a mali Perica, Jovica i Ivica sigurno ubacuju sve unutra bacajuci po 1 kamencic. U finalnom skoru posto je bure daleko (citaj nepogodan kod) Djokica izvlaci deblji kraj i gubi od klinaca, ne mnogo, ali gubi. A sada se situacija menja i bure se namesta na 1m. Sada i Djokica ubacuje uvek svih 5 kamencica (tek ponekad promasi). Sada mali DJokica odnosi pobedu. Shvatite ovo kao "pogodniji" kod. Ispada da sve shader intenzivne igre vole 4000 seriju (Assassin's Creed, COD4, Oblivion..), a verujem da ce ih u buducnosti biti sve vise. Jedini primer koji se ne uklapa je Crysis, ali on se brate ne uklapa nigde, to je teski nogokuc od igre. Probao sam za vikend 2x 9600GSO i daju celih 22fps u High 1280x1024 sa 4xAA, dok 4850 daje celih 33fps. Tragicno je u celoj prici sto jedna 9600GSO daje 19fps. ispada da je od SLI ubrzanje svega 15%?!?! Prva igra za koju zaista trebaju ili SLi ili CF i corak. Moram napomenuti da sam za 4850 u 3Dmarku03 napravio 40000 (znam, los mi CPU), a da su 2x9600GSO napravile 48800!!! Isto tako i SM3 skor 3Dmarka06 daje umesto 4200 6200 (opet mi slab CPU), dok 4850 ima 5300 (znam, znam, nejaki Athlon). Ajd da ne davim vise. Odo!! :wave:
 
Poslednja izmena:
Nedjo je dao lepe negacije bez trunke pojasnjenja, linkova ili bilo kakve podloge koja ukazuje na to da DAS nije u pravu. Napisao je svuda "netacno" i sad treba da to uzmemo zdravo za gotovo. 🙁
 
Mogu ovih nekoliko postova otici u adekvatnu temu,umesto da se obrisu.

Nedjo se ocigledano nije potrudio da malo procita o arhitektirama nVidia-e i Ati-a 😉

Nije 800 Shader, vec 800 Streaming processora!

Nebitno je kako se zove,bitno je na sta se misli.Ali ajde,to je mozda jedino sto je sporno,lose sam nazvao neke elemente GPU-a.Ali dovoljno je da se baci pogled na sliku(koju nisam ja napravio) i sve postaje jasno.

Netacno!

netacno!
Netacno!

Link,objasnjenje...nesto??

NV je brza na mestima na kojima je brza jer je kod optimizovan za NV arhitekturu, odnosno ne iskoriscava prednosti ATI arhitekture. Sami FLOPSI nemaju preterane veze sa DX/OGL kodom

FLOPS-i direktno proizilaze iz kolicine shader procesora i njihove frekvencije,tako da oni predstavljaju koliko GPU ima snage u hardware-u,a realne performanse nam pokazuju koliko je arhitektura efikasna.
Nedjo,prvo kazes zaista je 800 streaming procesora,a posle pusti FLOPS-ove,a ova dva pojma su u direktnoj funkcijskoj vezi.

otkud ti to da NV ima dve posebne "jedinice" za izvrsavanje transcedentalnih funkcija???

SM.png




Eto ti odgovor genuine!
Ja ne vidim koji si to odgovor dao coveku. 😉

Ajde nedjo malo detalja o tim streaming procesorima... u okviru shader procesora... jel oni rade nad istim threadom ili izvrsavaju "nezavisne" threadove?
Mislim da streamnig procesori u oviru shader procesora mogu raditi samo nad istim threadom,otuda ona prica da nVidia moze da vrti vise shader programa odjedamput,e sad drugo je pitanje ko ce ih pre izvrsiti-jasno je da je Ati u prednosti jer je odnos 5:1 s tim da taj 1 na strani nVidia-e radi na vecoj frekvenciji,pa sad opet prica o iskoriscenosti onih 5 kod Ati-a itd...🙂

Sve sto sam napisao je Yooyo ranije par puta objasnjavao,naravno mnogo bolje,a i na netu ima iformacija kolko hoces,tako da ne vidim sta je odjednom sporno.
 
Poslednja izmena:
nadam se da ce uskoro na B3D forumu biti clanak o Rv770 arhitekturi, pa mozemo u odovjenom thredu da razglabamo o tome koliko 'oces. Ovde vise necemo.
 
Fair enough.

@GoranM: Dobar ti je primer sa kamencicima.Trebao si dodati jos i to da Djokici treba malo vremena da skupi 5 kamecica u saku,a za to vreme ostala deca mogu pojedinacno da bace jedan pa jos jedan kamencic(veca frekvencija shadera) :d

:wave:
 
Fair enough.

@GoranM: Dobar ti je primer sa kamencicima.Trebao si dodati jos i to da Djokici treba malo vremena da skupi 5 kamecica u saku,a za to vreme ostala deca mogu pojedinacno da bace jedan pa jos jedan kamencic(veca frekvencija shadera) :d

:wave:

LOL!

Ali Djokica dok sakuplja kamenčiće `ladi ruku dok ostala deca dobijaju upale zglobova i laktova i moraju da stavljaju `ladne obloge (veći TDP, je8iga).

:wave:
 
Poslednja izmena:
LOL!

Ali Djokica dok sakuplja kamenčiće `ladi ruku dok ostala deca dobijaju upale zglobova i laktova i moraju da stavljaju `ladne obloge (veći TDP, je8iga).

:wave:

Pored toga i čučne 1 za 5 kamenčića, dok ostala deca 5 puta čučnu za isti broj kamenčića - čima se znatno više umaraju (greju).

A za to vreme Perica zato što je ladan´ može da uposli i drugu ruku za novih 5 kamenčića (Dual GPU) gde je leva ruka logično bangavija pa ne pogađa kao desna (ne skalira idealno), medjutim ni to ne umara Pericu već on seda na dupe u kamenčiće i sada ubacuje i nogama (Spider platforma i CrossFire X), gde noga nije još uvek vešta kao ruka, ali se popravlja (nove revizije drivera)
 
Poslednja izmena:
Pored toga i čučne 1 za 5 kamenčića, dok ostala deca 5 puta čučnu za isti broj kamenčića - čima se znatno više umaraju (greju).

A za to vreme Perica zato što je ladan´ može da uposli i drugu ruku za novih 5 kamenčića (Dual GPU) gde je leva ruka logično bangavija pa ne pogađa kao desna (ne skalira idealno), medjutim ni to ne umara Pericu već on seda na dupe u kamenčiće i sada ubacuje i nogama (Spider platforma i CrossFire X), gde noga nije još uvek vešta kao ruka, ali se popravlja (nove revizije drivera)

E svaka chast za ovu teoriju, al ima tu i istine bome 🙂
 
Na kraju ako Perica dođe sa kitom za kalibraciju, svaki kamenčić će proizvoditi pravilan zvuk u buretu (prikazivaće ispravno boje). Jeste da nema veze sa brzinom, ali svaki vic sa Pericom mora da se završi bezobrazno.
 
Na kraju ako Perica dođe sa kitom za kalibraciju, svaki kamenčić će proizvoditi pravilan zvuk u buretu (prikazivaće ispravno boje). Jeste da nema veze sa brzinom, ali svaki vic sa Pericom mora da se završi bezobrazno.

word!:d
 
Pored toga i čučne 1 za 5 kamenčića, dok ostala deca 5 puta čučnu za isti broj kamenčića - čima se znatno više umaraju (greju).
Cucne on jednom za 5 kamencica, ali su mu shuplji prsti pa uglavnom ispusti po koji kamencic (od 4 do 1).:d
 
Cucne on jednom za 5 kamencica, ali su mu shuplji prsti pa uglavnom ispusti po koji kamencic (od 4 do 1).:d

ali je o5 bolje nego da se saginje za svaki pojedinacno. a i moze da ga stigne isijas u buducnosti (novije igre uvek bolje leze ATI-ju :smoke🙂...
😛
 
ali je o5 bolje nego da se saginje za svaki pojedinacno. a i moze da ga stigne isijas u buducnosti (novije igre uvek bolje leze ATI-ju :smoke🙂...
😛
Pa i ovaj se saginje jer mu ispadaju tako sa ustvari jedan te isti kamencic uzima 2 puta.😀
Novije igre uvek bolje leze ATIju?:trust: Otkud to?🙂
 
Nedjo je dao lepe negacije bez trunke pojasnjenja, linkova ili bilo kakve podloge koja ukazuje na to da DAS nije u pravu. Napisao je svuda "netacno" i sad treba da to uzmemo zdravo za gotovo. 🙁

lepo.... 😉 ajde nedjo plz otvori taj thread o NV770 ili sta vec samo da pricitamo sta je to netacno.... 😉
 
Charlie D. je napisao novi clanak o "Nv problemima",ovaj put sam se nasmejao do suza zbog jedne njegove "projektovane" konverzacije izmedju 2 TSMC menadzera koji planiraju %ntualni udeo vafera za NV u 40nm procesu sledece godine.
http://www.theinquirer.net/gb/inquirer/news/2008/07/07/nvidia-meltdown-blame-game

Suppliers are a problem for Nvidia though, at least they are now. Trashing your suppliers like this is a dangerous thing to do, Nvidia needs them more than they need Nvidia. Can you imagine the scene at the next TSMC planning meeting where they are discussing who gets what allocation on the next tight process, and how much they pay?

TSMC Planner 1: How many wafers do we allocate for Nvidia a month?
TSMC Planner 2: The 40nm process is looking tight at first, do you agree?
TSMC Planner 1: Yeah, really tight.
TSMC Planner 2: Remember that time when NV was calling us [male rooster euphemism][oral suction euphemism]s to anyone who would listen? Wasn't that a fun time.
TSMC Planner 1: So 4 then?
TSMC Planner 2: 4K? That seems high.
TSMC Planner 1: No, 4.
Koji je car Charlie,4 😀.A da i ovo 😀 => [male rooster euphemism][oral suction euphemism]
 
Status
Zatvorena za pisanje odgovora.
Nazad
Vrh Dno