Šta je novo?

G8x vs R6xx in Rightmark3D 2.0

  • Začetnik teme Začetnik teme yooyo
  • Datum pokretanja Datum pokretanja

yooyo

Čuven
VIP član
Učlanjen(a)
28.06.2005
Poruke
10,877
Poena
730
Moja oprema  
Pristup internetu
  1. Optički internet
http://www.ixbt.com/video3/rightmark2.shtml

Ovi testovi su cista sintetika, ali su napravljeni da testiraju sve novitete DX10 API-a. Ujedno pokazuju i razlike izmedju dve arhitekture, kao i nedovrsenost drivera.

Tekst je na ruskom. Ko ne razume (ili nije ucio ruski u skoli kao mi matorci) moze da pokusa sa google translate servisom.
 
Nema sta da se ne razume, 8800GTS je oduvao 2900XT... Ocekujem odgovor na moj post tipa ATI je testiran sa drajverima od "pre par godina" ili nesto slicno..
 
chu 8800gts, 8600gts ga je oduvao u vecini testova. Samo, namerno su stavili 4xAA da bi mu dosli glave (2xxx seriji). Ono sto je ATI nazivao "superioran geometry shader " je ispalo "tu negde" sa nvidijom...'bala ih superskalarna arhitektura :wall:
 
Poslednja izmena:
chu 8800gts, 8600gts ga je oduvao u vecini testova. Samo, namerno su stavili 4xAA da bi mu dosli glave (2xxx seriji). Ono sto je ATI nazivao "superioran geometry shader " je ispalo "tu negde" sa nvidijom...'bala ih superskalarna arhitektura :wall:

E da,sad sam se stio onoga kad su se na netu pojavile informacije da je geometry shader R600-tke brzi 50x.Evo sta covek iz Ati-ja kaze o tome:
http://www.beyond3d.com/content/interviews/39/6

"The number was simply measured, running an application we wrote. But running some of the Microsoft SDKs (the vines DX10 demo comes to mind) shows similar deltas. It appears, though I hate speculating about other’s HW, that when running in data expansion, their GS execution loses a lot of its parallelism; my guess would be that that is their way of dealing with the data expansion – If you have hundreds of threads each one running dozens of elements in parallel, each generating, say, hundreds of bytes of data, you can quickly grow to MB’s of data. Keeping that on chip is not easily feasible. We overflow into DRAM, but maintain the full capabilities and performances; and with our memory bandwidth, this is a good thing. Our competition appears to reduce the data to a trickle, to keep the data on chip. But, it could simply be a driver bug ;-) "
 
ahahahaha 😀 nvidia ima driver bug sa kojim im i dalje sije karte...neverovatni su 😀 50x brze je na ovom testu zapravo 4 out of 5 2x sporije u geometry testovima...To je zato sto nisu oni pisali softwer...Mozda bi oni trebali onda da pocnu da pisu igre za svoje karte posto su ostali ocigledno nesposobni da to urade kako treba 😛 No, ovo je samo jos jedan test, pa i ovo sve treba uzeti sa rezervom, sto nas na kraju krajeva ne sprecava da se malo usput prisetimo nekih tako izjava i da se malo zabavimo 😀

PS. Sad mi pade napamet, posto AMD X2 ima bolji mem bandwidth od core 2 tehnologije (u nekim iole normalnim non-LN2 testovima), a ATI trpa podatke u DRAM, pa ih odande vadi, mozda zato i ne valjaju testovi ? Mozda su trebali testirati x2 6000+ i x2900xt vs 8800gts 640 @ c2d (e6600 npr)
 
Poslednja izmena:
ovo je sve samo ne test! Niko sem ruja koji su ga pisali nema pojma kako izgledaju ti shaderi.

no dobar je case study na temu kako danas uz odgovarajucu volju moze da se optimizuje shader za tacno odredjenu arhitekturu i kako to negativno moze da se odrazi na onu drugu, bez obzira sto i jedna i druga postuju DX10 spec. Sve je do konstrukcije samih shadera...
 
ovo je sve samo ne test! Niko sem ruja koji su ga pisali nema pojma kako izgledaju ti shaderi.

no dobar je case study na temu kako danas uz odgovarajucu volju moze da se optimizuje shader za tacno odredjenu arhitekturu i kako to negativno moze da se odrazi na onu drugu, bez obzira sto i jedna i druga postuju DX10 spec. Sve je do konstrukcije samih shadera...

isti je test kao i CoJ dx10 ... pa se ne secam da si napomenuo igde da nije merodavan 😉
 
isti je test kao i CoJ dx10 ...

shalis se?

kako znas da je isti?

jel znas kako izgledaju shaderi kojima su kreirani oni efekti?

Ako malo zdravog razuma upotrebis, slozices se da su oni rezultati sve samo ne realni...

U ostalom kakve veze ova tema ima sa CoJ u opste!??
 
Poslednja izmena:
@GX-X: Eric Demers je rekao da je moguci uzrok losih geometry shader performansi u njihovim testovima bag u drajverima.Covek je to skroz realno iskomentarisao,nije uopste pljuvao po 'konkurencij'i,i sam kaze da ne voli da komentarise konkurenciju.
Ovo sam naveo cisto da se vidi zbog koje je sitnice nastao citav hype po internetu oko 50x boljih geometry shader performansi
 
A ovde,stvarno,jedino u testiranju geometry shadera R600 radi kako treba - znaci nisu slagali,stvarno dobro rade geometry 😀

Kod nekih testova R600 je toliko los da je sigurno u pitanju nedovrsen drajver.
 
shalis se?

kako znas da je isti?

jel znas kako izgledaju shaderi kojima su kreirani oni efekti?

Ako malo zdravog razuma upotrebis, slozices se da su oni rezultati sve samo ne realni...

U ostalom kakve veze ova tema ima sa CoJ u opste!??

mislio sam na merodavnost i realnost ovog testa Nedjo, a ne na shader kod. Ako bas moram da crtam: ovaj test je merodavan po ATI u dx10 isto kao i CoJ dx10 po nVidiu. Jel sam sad bio jasniji ? 🙂

:wave:
 
@Nedjo:
Mozes da skines source svih DX10 shadera pa prosledi nekome u ATI-u da ih pogleda. Link je:
http://www.ixbt.com/video/itogi-video/ini/rmdx10.rar

'fala. Kanda su to ljudi vec uradili:

http://forum.beyond3d.com/showthread.php?t=42984

"So, I poked around at the source to see what the GS numbers were doing.

The first test (Galaxy) has basically no amplification--it takes a point and splits it into two triangles. I'm not even convinced that the bottleneck is the GS.

The second test (Hyperlight) has much, much more amplification. However, it also has a ton of texturing. When the GS load is "balanced," I think you're seeing texturing bottlenecks. When the GS load is "heavy," I think you're seeing GS bottlenecks on the G80 and texturing bottlenecks on the R600.

So, I'm not convinced these are truly accurate assessments of relative GS-specific performance.


Povrh svega, bice da RM3D 2.0 radi sa 2D frekvencijama na 2900-ci:

http://img165.imageshack.us/my.php?image=lollt7.jpg

cenim da ce biti jos price o ovom ruskom testu.
 
To sa 2d clockovima se desilo samo kod jednog lika.. svima ostalima radi sa 3d clockovima.
 
Interesantan je "Fire" test. Tu ima samo jedan fetch iz texture a zatim gomila sin/cos poziva. Ovaj shader je nocna mora za R600 jer od 5 jedinica u procesoru 4 su ALU, a samo jedna (specijalna) je za transcedentalne funkcije (sin, cos, tan, log, exp, ...). Ako pogledate source code shadrea Fire (DX10_PS4A.fx) usko grlo je funkcija GetGradient koja 2x poziva sincos. U shaderu Mineral ima 35 poziva sin i cos dok u Fire ima preko 130 sin i cos.

Sreca je sto se ovakvi shaderi ne koriste u igrama. Ipak.. ovaj test pokazuje koliko je shader kompajleru tesko da optimizuje shader i na kakvim mukama su pisci drivera za R600.
 
Ovi inzenjeri u ATi-ju kao da su zaboravili 'pra-iskonski' inzenjerski princip:
KISS - "Keep It Simple, Stupid"
http://en.wikipedia.org/wiki/KISS_principle
the KISS principle states that simplicity in design should be a key goal
When solving a problem, there's sometimes a tendency towards complicated solutions that are harder to deal with than the problem, or ostensibly 'clever' solutions that don't actually work for all possible forms of the problem.
 
Poslednja izmena:
Ma bre, nek samo odustanu više od tog principa "pravimo GPU za budućnost" i biće sve ok. Nek naprave zastarelu varijantu, samo neka bude efikasna u realnom radu. To nikako da im pođe za rukom još od X800...
 
Za R00, da bi se postigle perfomanse, neko mora da optimizuje shader program.. covek ili kompajler. Za sada kompajler slabo radi taj posao.
Nadam se da ce ga srediti da radi bolje jer neverujem da ce neko imati vremena/para/resursa da rucno optimizuje shader program da bi postigao zadovoljavajuce performanse.
 
Poslednja izmena:
ahahahaha 😀 nvidia ima driver bug sa kojim im i dalje sije karte...neverovatni su 😀 50x brze je na ovom testu zapravo 4 out of 5 2x sporije u geometry testovima...To je zato sto nisu oni pisali softwer...Mozda bi oni trebali onda da pocnu da pisu igre za svoje karte posto su ostali ocigledno nesposobni da to urade kako treba 😛 No, ovo je samo jos jedan test, pa i ovo sve treba uzeti sa rezervom, sto nas na kraju krajeva ne sprecava da se malo usput prisetimo nekih tako izjava i da se malo zabavimo 😀

PS. Sad mi pade napamet, posto AMD X2 ima bolji mem bandwidth od core 2 tehnologije (u nekim iole normalnim non-LN2 testovima), a ATI trpa podatke u DRAM, pa ih odande vadi, mozda zato i ne valjaju testovi ? Mozda su trebali testirati x2 6000+ i x2900xt vs 8800gts 640 @ c2d (e6600 npr)

Covek nije mislio bukvalno da imaju bug vec da sa tehnicke strane to nije pametno!

Tehnicki, kada Geometry Shaderi rade veliki broj thread-ova paralelno dobiju se megabajti podataka i stvara se zagusenje. Kod ATI-ja kada dodje do toga - GPU salje visak podataka u DRAM, a kod nVidia-e GPU tezi da zadrzi podatke u sebi kako vec smanjujuci ih.
 
Za R00, da bi se postigle perfomanse, neko mora da optimizuje shader program.. covek ili kompajler. Za sada kompajler slabo radi taj posao.
Nadam se da ce ga srediti da radi bolje jer neverujem da ce neko imati vremena/para/resursa da rucno optimizuje shader program da bi postigao zadovoljavajuce performanse.

Koliko ja znam na starim GPU kompajer je bio u drajveru (i trosio je CPU cikluse), a na novoj generaciji GPU sa unified shader-ima kompajler je u samom GPU. Sto se tice R6xx - situacija je takva kakva jeste. Nadam se samo da ce proizvodjaci software-a da budu korektniji i da vise rade na optimizaciji a manje na marketingu.
 
Kompajler je uvek u driveru. E sad.. mozda MS DX10 pokusava da kompajlira shader i assembly salje driveru na dalju doradu ili DX10 salje ceo shader program driveru da ga iskompajlira. U svakom slucaju... kompajliranje odradjuje glavni procesor, dok GPU samo izvrsava kompajlirani program.
 
Poslednja izmena:
Covek nije mislio bukvalno da imaju bug vec da sa tehnicke strane to nije pametno!

Tehnicki, kada Geometry Shaderi rade veliki broj thread-ova paralelno dobiju se megabajti podataka i stvara se zagusenje. Kod ATI-ja kada dodje do toga - GPU salje visak podataka u DRAM, a kod nVidia-e GPU tezi da zadrzi podatke u sebi kako vec smanjujuci ih.

I kao sto vidimo iz prakse, covek je pogresno mislio...i dobismo r600
 
Poslednja izmena:
PS. Sad mi pade napamet, posto AMD X2 ima bolji mem bandwidth od core 2 tehnologije (u nekim iole normalnim non-LN2 testovima), a ATI trpa podatke u DRAM, pa ih odande vadi, mozda zato i ne valjaju testovi ? Mozda su trebali testirati x2 6000+ i x2900xt vs 8800gts 640 @ c2d (e6600 npr)

evo ga jedan:LINK
full zelena masina 😉

mobo: asus m2r32-mvp
cpu: a64 6000+
ram: 2048mb OCZ reaper PC8500
video: radeon hd 2900xt
psu: SilverStone Olympia OP1000
cooling:vapochill ls
 
Nije forbidden, nego moras da prvo odes na ixbt sajt (vidi prvu poruku u temi) pa tek tamo da kliknes na doticni link. Kada sam nedji replicirao, nisam znao za ovaj problem.
 
Baci link u flashget i radiće (ups, jel ima FG za Mac?). Ja sam ga našao ovde pre nego što je yooyo okačio link, a u međuvremenu ga sigurno imaš na milion mesta (google).
 
nemam Flashget ima nesto bolje 😛 - iGetter (kako bi se inace zvao 😀) ...

uf, kad me vuces za jezik http://www.pure-mac.com/dlm.html spisak download managera za Mac...
 
Jeste, jeste, kod ATi-ja je uvek nedorvsen drajver, te neoficijalan test, te pristrasnost medija (nedjo 🙂).

Dajte molim vas, zasto konstantno odbacujete argumente u stranu!
 
Nazad
Vrh Dno