Šta je novo?

Sweene & Carmack mini intervju!

  • Začetnik teme Začetnik teme Nedjo
  • Datum pokretanja Datum pokretanja

Nedjo

Čuven
VIP član
Učlanjen(a)
12.07.2000
Poruke
6,934
Poena
800
Definitivno najbolji sajt o aspektima vezanim za GPU-ove i 3D tehnologiju generalno ima mali intervju sa dva najuticajnija lika u gaming industriji. Evo sta su ih pitali i kako su oni odgovarali:

In our interview with Eric and Richard of ATI they mentioned they went in the direction of tripling the ALUs versus the TMUs after talking with you for instance. My question would be: do you see this as a good direction? Are you working on shaders which require a lot of ALU while keeping TMU usage constant to today?

John: I think it is clear that the ratio of math to texture fetches is increasing.

Tim: It's a definite trend that ALU usage in shaders is going up at a faster rate than TMU usage, so it's reasonable that the hardware should increase ALU's faster than TMU's. What ratio is ideal is debatable; it depends on a whole lot of variables, but fortunately it's easy to see whose tradeoffs win at a given price level by running some benchmarks.

The X1000 series of ATI cards don't implement an actual texture fetch in the vertex shader, unlike NVIDIA's GeForce 6 and GeForce 7 series, preferring instead to get the texture information from a vertex buffer that the programmer has to setup in the pixel shader. Which implementation do you prefer?

John: For vertexes, I think more often about looking up data in a table rather than indexing an image, but I can see either perspective.

Tim: We don't use vertex texture fetch in UE3 right now, but I expect we'll be using it in the future for moving more of our displacement-mapped terrain logic to the GPU.

Tim also dropped the following comment to us with regards to Unreal Engine 3:

Tim: We'll be making a UE3 benchmark available several months before shipping UT2007 on PC, in order to encourage the hardware folks to optimize their drivers. We're not doing this now, because at our stage in development many aspects of our rendering pipeline aren't fully optimized, and if we encouraged IHV's to optimize for it now (by releasing a benchmark), they would end up wasting a lot of time optimizing code paths that aren't reflective of a final, shipping UE3 project. Regarding the timeline, we'll be actively developing Unreal Engine 3 throughout the current hardware generation -- all the way through 2009.


Prema ovim odgovorima, nema sumnje koji ce od aktuelnih akceleratora (R580 vs. G70) biti brzi u u Unreal3 i Megatexturing Extended masinama! Naravno po izlasku G80 slika se moze dijemtralno izmeniti...

P.S

Jedva cekam U3 benchmark, narocito uzevsi u obzir koliko je 3DMark06 ne upotrebljiv za evaluaciju perfomansi NextGen naslova!!
 
Poslednja izmena:
Tim: It's a definite trend that ALU usage in shaders is going up at a faster rate than TMU usage

To je tacno, ali samo zato sto ATI, nVidia preporucuju da se TMU sto manje koristi -- jer je bandwidth limitirajuci faktor za to. Drugim recima:

so it's reasonable that the hardware should increase ALU's faster than TMU's

Kad se prevede na srpski znaci "razumljivo je da hardver treba da poveca broj ALU jedinica brze nego broj TMU jedinica" jer ovih drugih ni ne moze zbog fizickih ogranicenja vezanih za memoriju.

Ako to ne vidis, stvarno mi nisi jasan. Zar ne mislis da oni ne bi digli i broj TMU jedinica da mogu?!? Na kraju to najvise utice na performanse finalnog proizvoda, a oni ga zakucase na 16 i kraj. Ta prica je dogovorna kupovina vremena dok se ne pronadje resenje za pravi problem.
 
Poslednja izmena:
audiofreak je napisao(la):
To je tacno, ali samo zato sto ATI, nVidia preporucuju da se TMU sto manje koristi -- jer je bandwidth limitirajuci faktor za to. Drugim recima:



Kad se prevede na srpski znaci "razumljivo je da hardver treba da poveca broj ALU jedinica brze nego broj TMU jedinica" jer ovih drugih ni ne moze zbog fizickih ogranicenja vezanih za memoriju.

Ako to ne vidis, stvarno mi nisi jasan. Zar ne mislis da oni ne bi digli i broj TMU jedinica da mogu?!? Na kraju to najvise utice na performanse finalnog proizvoda, a oni ga zakucase na 16 i kraj. Ta prica je dogovorna kupovina vremena dok se ne pronadje resenje za pravi problem.
Pa meni nije jasno o cemu se onda ti sa mnom raspravljas? BW jeste limitirajuci faktor to obojica znamo (ja to nigde ne sporim). Da bi se postigao zahtevani realizam putem texture shadera bio bi neophodan abnormalan BW, zato se ne ide tim putem! Aritmeticki intenzivni shaderi su resenje i trend koji ce se samo pojacati u (bliskoj) buducnosti.
Uvecavanje performansi finalnog proizvoda dodavanjem texture unita bi se dogodilo samo ako bi developeri krenuli u potpuno drugom smeru i umesto aritmetickih, okrenuli se texture intenzivnim shaderima! A to se nece dogoditi...
 
Nedjo je napisao(la):
Pa meni nije jasno o cemu se onda ti sa mnom raspravljas? BW jeste limitirajuci faktor to obojica znamo (ja to nigde ne sporim). Da bi se postigao zahtevani realizam putem texture shadera bio bi neophodan abnormalan BW, zato se ne ide tim putem! Aritmeticki intenzivni shaderi su resenje i trend koji ce se samo pojacati u (bliskoj) buducnosti.
Uvecavanje performansi finalnog proizvoda dodavanjem texture unita bi se dogodilo samo ako bi developeri krenuli u potpuno drugom smeru i umesto aritmetickih, okrenuli se texture intenzivnim shaderima! A to se nece dogoditi...

Pa nece jer ih ne ohrabruju da to rade kao sto ih ohrabruju da vise racunaju nego sto fetch-uju. Ako bi bilo vise TMU i bolje kesiranje tekstura, odmah bi i AA radio bolje zar ne? Cini mi se da se ovako umesto pravog resenja dobija neki surogat.
 
Možda bi bilo bolje rešenje da imamo "prave" hi poly igre, koje izgledaju 1% bolje ili isto, ali da kartice koje bi mogle da ih pokrenu kostaju 2000 dolara, jer moraju da imaju 512-bit magistralu i giga memorije i GPU sa 32 ili 48 ROP jedinica i bar 64 TMU-a...? 🙂
 
byMaX je napisao(la):
Možda bi bilo bolje rešenje da imamo "prave" hi poly igre, koje izgledaju 1% bolje ili isto, ali da kartice koje bi mogle da ih pokrenu kostaju 2000 dolara, jer moraju da imaju 512-bit magistralu i giga memorije i GPU sa 32 ili 48 ROP jedinica i bar 64 TMU-a...? 🙂

Pa to ce se uskoro i desiti zar ne?
Sumnjam da bi izgledalo isto ili samo 1% bolje, a bojim se da ce isto biti i sa vise PS jedinica u odnosu na broj ROP/TMU jedinica. Doduse cena nece biti 2000 dolara 😛
 
audiofreak je napisao(la):
Pa nece jer ih ne ohrabruju da to rade kao sto ih ohrabruju da vise racunaju nego sto fetch-uju. Ako bi bilo vise TMU i bolje kesiranje tekstura, odmah bi i AA radio bolje zar ne? Cini mi se da se ovako umesto pravog resenja dobija neki surogat.
Objektivno, CGI moze dalje da napreduje ka (foto)realizmu ili kroz eksponencijalno intenzivnije fetchovanje ili kroz exponencijalno kompleksniju aritmetiku shadera! Nadam se da ti je jasno da objektivnih hardevrskih mogucnosti za ono prvo nema! A zasto nema, pa sam si gore naveo limitirajuce faktore. Kako onda ocekujes da IHV-ovi "ohrabruju" developere da vise fetchuju?
Mislim da bi slicna analogija bila kao kada bi ocekivao od CPU vendora da ohrabruju developere za intenzivnije pisanje FPU koda i zanemarivanje hardverskih resursa koje su im stavilina raspolaganje sa novom generacijom proizvoda - SIMD operabilnost, a koja omogucava bolje performanse i nove mogucnosti softvera.
Za one koji nisu upuceni u srz rasprave: ovde se u opste ne prica o deficitu geometrijske detaljnosti novih naslova!!
 
Poslednja izmena:
Nedjo je napisao(la):
Objektivno, CGI moze dalje da napreduje ka (foto)realizmu ili kroz eksponencijalno intenzivnije fetchovanje ili kroz exponencijalno kompleksniju aritmetiku shadera! Nadam se da ti je jasno da objektivnih hardevrskih mogucnosti za ono prvo nema! A zasto nema, pa sam si gore naveo limitirajuce faktore. Kako onda ocekujes da IHV-ovi "ohrabruju" developere da vise fetchuju?
Mislim da bi slicna analogija bila kao kada bi ocekivao od CPU vendora da ohrabruju developere za intenzivnije pisanje FPU koda i zanemarivanje hardverskih resursa koje su im stavilina raspolaganje sa novom generacijom proizvoda - SIMD operabilnost, a koja omogucava bolje performanse i nove mogucnosti softvera.
Za one koji nisu upuceni u srz rasprave: ovde se u opste ne prica o deficitu geometrijske detaljnosti novih naslova!!

Naravno da mi je jasno da nema mogucnosti. Ono sto hocu da kazem da su i proizvodjaci GPU-ova "udarili u plafon" (ili ce vrlo brzo udariti) kao proizvodjaci CPU-ova.

Napravicu grubo poredjenje, nemoj mi zameriti sto sam uzeo AMD kao primer:

2003. su Athlon 64 procesori bili prodavani kao "zalog za buducnost". Veci adresni prostor, rad sa 64-bitnim integerima i sta ti ja znam.

2006. dakle nakon cele tri godine 64-bitni OS nije zaziveo, softver je najblaze receno sporadican, drajvera za mnoge stvari nema cak ni od ozbiljnijih firmi (primer nVidia WDM capture, Canon, Epson, HP stampaci, skeneri, etc).

U medjuvremenu su prosla Newcastle, Winchester i Venice jezgra, preslo se od S754 na S939 i od nForce3 do nForce4 koji je uzgred doziveo par revizija. Za DDR2 memoriju trebace jos novih jezgara, chipsetova, ploca.

Sa druge strane sada imamo ATI i ring bus mem. ctrl. i opet se prica o zalogu za buducnost.

Ljudi konacno treba da shvate da to nije za njihovu buducnost nego za proizvodjacevu. Oni ce napraviti novu reviziju cipa koji smo kupili, stavice je na novu stampanu plocu, stavice GDDR4 i ljudi ce morati ponovo da iskaslju 400-700€ za tu "buducnost".

Poenta svega ovoga je da su, u slucaju AMD-a, sve te platforme koje su prosle podrzavale 64 bita, a retko ko je imao nekakve vajde od njih. Isto i sa ATI-jevim memorijskim kontrolerom. Koja je uopste poenta tog cuda, ako je memorijski bandwidth ogranicen najpre samim cipovima, zatim malim brojem RBE i TMU i na kraju softverom? Zasto ne ugradjuju opcije od kojih imamo odmah koristi?!? Po mom misljenju vi novinari bi trebali da ste mnogo kriticniji prema takvim polu-proizvodima. Treba da postavite pitanje sta kupac dobija SAD sa tim kontrolerom, a ne sta ce dobiti sa revizijom 7b i GDDR10 memorijom jer kupac SAD kupuje, i nece mu besplatno upgrade-ovati memorijske cipove kasnije.

Evo recimo X1600 Pro treba da bude takmac za 6600GT i po performansama i po ceni, a ima 2x manji fill rate cim se radi multitexturing sa vise od 2 teksture. Iako je baziran na novoj arhitekturi i 90nm procesu ne zasluzuje pozitivan review dokle god GT moze da se nadje za iste ili manje pare.

I na kraju analogija ti nije dobra, SIMD omogucava bolje performanse, a komplikovaniji shaderi zahtevaju bolje performanse. Sa prvim kupac dobija nesto for free od arhitekture koju poseduje, a sa drugim gubi, tj. mora da investira u jaci hardver.

Nedjo, evo sta ovi tvoji sa beyond3d kazu za X1900 arhitekturu:

ATI's decisions for the R580 chip that powers the X1900 have been interesting, to say the least, even a little bold in some ways. Even though we've looked at the X1900 fairly thoroughly in this article we've possibly yet to see it pay off fully. As shown by the pure pixel shader tests, but not fully realised by the games, this really is an architecture that has more to come, but only if games are going to go in the way that ATI are predicting, and quickly. For now, though, its clear that Radeon X1900 XTX offers a performance increase over X1800 XT in all situations, but it also has the price premium to match.

Znaci misle ljudi isto sto i ja


[offtopic]
@Nedjo:

U konfiguraciji dotične gospode:

Dual eVGA 6800 Ultra Video cards in SLI

A na Lightwave sajtu:

Known issues:

-Some of the functions of the GLSL Hardware Shaders are currently having conflicts with ATI graphics cards. NewTek and ATI are working on this issue, so be sure to keep up with the latest drivers for your graphics card.

Šta ti ono beše reče o ATI-ju i njihovim OpenGL drajverima?!?

[/offtopic]
 
Poslednja izmena od urednika:
Mislim da gresis u par stvari, a obzirom za koje firme "navijas" 😉 zachudjje me kako rezonujes.

Po pitanju progresa, da se Intel vodio "SAD" filozofijom, nkada ne bi odustao od Rambusa, nikada ne bi presao na DDR2 i gurao ga onako uporno i posveceno, nikada ne bi potencirao da je vreme eutanaziranja x86 arhitekure i foriranja programera da nauce EPIC programiranje... ima toa jos, ali da se zaustavimo na ovome (ne zameri sto sam uzeo Intel za primer 😉)

Po pitanju filratea, pa jos pred izlazak NV30 procesora Dejvid Kirk (svi znamo ko je baja) je mantrao pricu da im nije cilj da filuju frejm sa jos vise piksela, vec sa "pametnim" pikselima. Poenta price je da je covek vaspostavio trend koji je filrate stavio u drugi plan, a operacije nad pkselima u prvi. Mislim, fillrate je odavno gurnut u drugi plan i nije mi jasno zasto se sada cudis (doduse ti si tek od skora uplivao u 3D vode).

Po pitanju mem. ctrl-a kod ATI-ja. U pitanju je ekstra resenje, koje je na prvom mestu ATI-ju zalog za buducnost. Naravno da ce i krajnji korisnici imati direktn i indirektne benefite, a na primeru OGL igara videli smo da su te pogodnosti dostupne "SAD"!

Drago mi je sto se na kraju slazemo, jer delim isljenje sa Daveom po pitanju R580. Bas zato sam i dao intervju dva najznacajnija developera koji otvoreno kazu da je put koji potencira R580 logican korak napred, a eto dve od tri najznacanije NexGen 3D masine ce omoguciti potpuno eksponiranje R580 filozofije ALU:TMU odnosa (obzirom da znam da CryTek ima prilicno bliske odnose sa ATI-jem, ne sumnjam da ec i treca najznacajnija NExGen masina biti "potaman" R580-ci)
Poz
Nedjo
 
audiofreak je napisao(la):
[offtopic]
@Nedjo:

U konfiguraciji dotične gospode:

Dual eVGA 6800 Ultra Video cards in SLI

A na Lightwave sajtu:

Known issues:

-Some of the functions of the GLSL Hardware Shaders are currently having conflicts with ATI graphics cards. NewTek and ATI are working on this issue, so be sure to keep up with the latest drivers for your graphics card.

Šta ti ono beše reče o ATI-ju i njihovim OpenGL drajverima?!?

[/offtopic]
Pa sta sam rekao? Jesam li igde rekao da u profi OGL primeni prednost dajem ATI-ju? S druge srtane, lepo tamo rekoshe da rade ljudi na ispravljanju problema, tako da ce vlasnici novih FireGL kartica zasnovanih na X1K seriji moci bez problema da rade u LW-u.
 
Nedjo je napisao(la):
Poenta price je da je covek vaspostavio trend koji je filrate stavio u drugi plan

Ali i dalje nVidia uglavnom ima bolji fill rate, sta ti to govori?

Nedjo je napisao(la):
Po pitanju mem. ctrl-a kod ATI-ja. U pitanju je ekstra resenje, koje je na prvom mestu ATI-ju zalog za buducnost. Naravno da ce i krajnji korisnici imati direktn i indirektne benefite, a na primeru OGL igara videli smo da su te pogodnosti dostupne "SAD"!

Ne, nisu jos dostupne. Bice dostupne sa novim tipom memorije za koju ces morati da promenis karticu. To sto su oni napokon overhaulovali source code svojih drajvera i optimizovali ga pa brze radi nema nikakve veze sa ovim kontrolerom. To pokazuju bandwidth testovi u gpubenchu. Ako imas X1900 na raspolaganju, skini GPUBench pa poteraj, zivo me zanimaju rezultati.
 
Nedjo je napisao(la):
Pa sta sam rekao? Jesam li igde rekao da u profi OGL primeni prednost dajem ATI-ju? S druge srtane, lepo tamo rekoshe da rade ljudi na ispravljanju problema, tako da ce vlasnici novih FireGL kartica zasnovanih na X1K seriji moci bez problema da rade u LW-u.

Khm, ovde nije cak reci ni o Quadro .vs. FireGL drajverima i karticama nego regularnim.
 
audiofreak je napisao(la):
Ali i dalje nVidia uglavnom ima bolji fill rate, sta ti to govori?



Ne, nisu jos dostupne. Bice dostupne sa novim tipom memorije za koju ces morati da promenis karticu. To sto su oni napokon overhaulovali source code svojih drajvera i optimizovali ga pa brze radi nema nikakve veze sa ovim kontrolerom. To pokazuju bandwidth testovi u gpubenchu. Ako imas X1900 na raspolaganju, skini GPUBench pa poteraj, zivo me zanimaju rezultati.
baci mi link za GPU Bench!
 
Nazad
Vrh Dno