Nvidia tvrdi - CPU je mrtav

SOCOM · 13.05.2008

Wait a minute, that's me
Why am I only three years old again
Spinning and spinning and spinning

Pochinjaem da uzivam u ovim ratovima, FlameWar je prava stvar😛

Nedjo · 13.05.2008

gx-x je napisao(la):
Sta je Larrabee onda po tvojoj ili intelovoj definiciji ? Ja sam zbunjen. Intel kaze ne treba GPU, a Larrabee nije CPU, nvidia kaze ne treba CPU, a intel i ne pravi CPU da zameni GPU...opsti haos u mojoj glavi kad mislim o ovoj tematici. Molim te razjasni i definisi LArrabee da znamo o cemu pricamo. Ja sam mislio ako radi x86 onda je CPU, ocigledno sam lose mislio ili je i to samo neki PR spin...

evo da ja malo izigravam Jensenovog drvenog advokata, pa da ti odgovorim: Larrabee je Slideware 😉

gx-x · 13.05.2008

Hvala Nedjo. SLideware..ccc...A i shema je stvarno...GI radi i sa rasterizacijom, GPU fizika odavno radi na GPU, sad je cak i kroz DX podrzana...ovo ostalo iz tabele ni ne znam sta je niti da li mi treba lol kad sam glup *** 😀

edit: lol za HD audio video processing. Audio prebacuje genuinu sto se koristi brojkama sa matorih intel proceosra i M$ kompajlera, a ovde intel poredi rivu TNT sa Larrabee.

yooyo · 13.05.2008

@audio...
Kako napreduje to mnozenje matrica? 🙂

@nedjo:
Ako je Larrabee skip od X IA jezgara sa dodatnim instrukcijama za vektorsku matematiku on i dalje nece moci da se nosi u igrama sa NVidiom ili ATI-em. Mozda ce moci da melje neke algoritme i da racuna razna cuda, ali u igrama ce biti slab.

Ajde nek neko napravi poredjenje arhitektura.. npr 3870 i Larrabee. 3870 je 5-way superskalarna sprava a kakav je larrabee po tom pitanju? Da li ce svako jezgro da izvrsava poseban pogram ili ce jezgra da imaju zajednicki IP (instr. pointer) i izvrsavace identican program?

Sto se NVidije tice, njihov dizajn G80 i G92 je fantastican. Gigathread engine se brine da svi procesori uvek nesto rade. Slicno je i kod R600 & R670. Takav scheduler omogucava veliku efikasnost. Neke stvari su usavrsili maksimalno.. npr.. fetch iz texture ume da potraje. Task scheduler ce da detektuje takve stvari i da dok mem ctrl dovuce podake iz memorije tom procesoru dati neki drugi zadatak. Na kraju krajeva, kad stigne podatak, scheduler ce nastaviti pauzirani proces. Kod G80 scheduler vodi racuna o 1024 threada nad 128 procesora.

Da li ce larrabee da ima nesto slicno. Sta ce IA jezgro da radi dok ceka na podatak iz memorije?

shimeco · 13.05.2008

Porocitao sam celu vasu raspravu. Moram priznati, da generalno nisam (ni blizu) potkovan da pratim vasu raspravu, a kamoli da nesto komentarisem. Ali hteo bih da vam kazem kako ja gledam na neke stvari pa ako gresim neka me neko ispravi.
Ja nisam igrac i mnogo me cak to i nezanima. Ali sa racunarom sam u proseku 10-tak sati dnevno.
Bavim se audiom, i moje gledanje (mada laicko poklapa sa Audifreak-ovim) na stvari je otprilike ovako.
Integrisana grafika, zasto ne. Pa manje vise vi svi koristite integrisane audio karte. Ja sam svoju audio kartu platio 5000e.
Po toj logici bi ja trebao da kazem da je cista glupost integrisana audio karta.
Kada sam kupovao masinu (koju trenutno koristim) pre nesto vise od godinu ipo dana za procesor core 2 duo 6600 sam dao oko 400e a za P5B Deluh se vise i nesecam u tom momentu sam za grafiku dao oko 60-tak evrica.
Sta hocu reci: U mom poslu je jako vazna audio karta i procesorska snaga, jer kako god ja to zacas zatrpam. Pogotovo kada radim na 96Khz, uvek je malo, a grafika, nezani ma me uopste.
Elem, sigurno da ce ljudi profesionalci u videu (i igrace vrhunskih igrica tretiram kao profesionalce) uvek teziti sto boljim performansama u grafici, samim tim ce i postojati proizvodjaci diskretnih grafika. Kao sto su i skupe audio karte. Ali predpostavljam da ce integrisana grafika zadovoljiti moje (a mozda i vece potrebe) za grafikom, kao sto integrisana adio varijanta zadovoljava vecinu vas, a meni nesluzi nicemu. Nevidm tu neki velik problem sem da ce proizvodjaci GPU-a na kraju isi samo na najzahtevnie korisnike. Pa sta mislite da recimo Creativ nije osetio po dzepu pojavu integrisanog audia koji sasvim pristojno zadovoljava sve zahteve 5.1 pa i 7.1 i na 96K ako treba.
Ali recimo Digi Designi sigurno nije, jer su oduvek gadjali samo profesionalno trziste.
Tako da mi je negde prirodno zasto se NVIDIA rita po pitanj ovoga, jer ce jednostavno izgubiti veliki deo kolaca, i to onaj najunosniji, velike produkcije nize klase.
A Cpu, kako bez njega, pa za moj posao se od racunara to najvise i trazi.

genuine · 13.05.2008

shimeco je napisao(la):
Porocitao sam celu vasu raspravu. Moram priznati, da generalno nisam (ni blizu) potkovan da pratim vasu raspravu, a kamoli da nesto komentarisem. Ali hteo bih da vam kazem kako ja gledam na neke stvari pa ako gresim neka me neko ispravi.
Ja nisam igrac i mnogo me cak to i nezanima. Ali sa racunarom sam u proseku 10-tak sati dnevno.
Bavim se audiom, i moje gledanje (mada laicko poklapa sa Audifreak-ovim) na stvari je otprilike ovako.
Integrisana grafika, zasto ne. Pa manje vise vi svi koristite integrisane audio karte. Ja sam svoju audio kartu platio 5000e.
Po toj logici bi ja trebao da kazem da je cista glupost integrisana audio karta.
Kada sam kupovao masinu (koju trenutno koristim) pre nesto vise od godinu ipo dana za procesor core 2 duo 6600 sam dao oko 400e a za P5B Deluh se vise i nesecam u tom momentu sam za grafiku dao oko 60-tak evrica.
Sta hocu reci: U mom poslu je jako vazna audio karta i procesorska snaga, jer kako god ja to zacas zatrpam. Pogotovo kada radim na 96Khz, uvek je malo, a grafika, nezani ma me uopste.
Elem, sigurno da ce ljudi profesionalci u videu (i igrace vrhunskih igrica tretiram kao profesionalce) uvek teziti sto boljim performansama u grafici, samim tim ce i postojati proizvodjaci diskretnih grafika. Kao sto su i skupe audio karte. Ali predpostavljam da ce integrisana grafika zadovoljiti moje (a mozda i vece potrebe) za grafikom, kao sto integrisana adio varijanta zadovoljava vecinu vas, a meni nesluzi nicemu. Nevidm tu neki velik problem sem da ce proizvodjaci GPU-a na kraju isi samo na najzahtevnie korisnike. Pa sta mislite da recimo Creativ nije osetio po dzepu pojavu integrisanog audia koji sasvim pristojno zadovoljava sve zahteve 5.1 pa i 7.1 i na 96K ako treba.
Ali recimo Digi Designi sigurno nije, jer su oduvek gadjali samo profesionalno trziste.
Tako da mi je negde prirodno zasto se NVIDIA rita po pitanj ovoga, jer ce jednostavno izgubiti veliki deo kolaca, i to onaj najunosniji, velike produkcije nize klase.
A Cpu, kako bez njega, pa za moj posao se od racunara to najvise i trazi.

a kad bi znao da graficka karta moze da obradi tvoj zvuk 10 puta brze od najbrzeg procesora onda bi shvatio da graficka karta vise nije graficka karta nego je graficko/audio karta , mozda i graficko/video/fft karta

yooyo · 13.05.2008

Moze graficka da krcka i zvuk tj. da odradjuje efekte i miksuje mnogo veci broj kanala nego sto to moze CPU... i to prosecna karta. Problem je kasnjenje, jer slanje sempla iz sysmem na graficku i skidanje sa graficke u sysmem pa u zvucnu ume da potraje ~10-20 ms, sto audiofilima smeta.

genuine · 13.05.2008

Slazem se skroz, ali stvar je ako je u pitanju ne realtime obrada zvuka... a covek verovatno o tome prica ...

audiofreak · 13.05.2008

yooyo je napisao(la):
@audio...
Kako napreduje to mnozenje matrica?

Sa Intelovim kompajlerom odlicno 😉

gx-x je napisao(la):
Sta je Larrabee onda po tvojoj ili intelovoj definiciji ? Ja sam zbunjen. Intel kaze ne treba GPU, a Larrabee nije CPU, nvidia kaze ne treba CPU, a intel i ne pravi CPU da zameni GPU...opsti haos u mojoj glavi kad mislim o ovoj tematici. Molim te razjasni i definisi LArrabee da znamo o cemu pricamo. Ja sam mislio ako radi x86 onda je CPU, ocigledno sam lose mislio ili je i to samo neki PR spin...

Znaci ako nisam jedno deset puta napisao Larrabee je GPU onda nista nisam napisao u ovom threadu! :wall:

genuine je napisao(la):
a kad bi znao da graficka karta moze da obradi tvoj zvuk 10 puta brze od najbrzeg procesora onda bi shvatio da graficka karta vise nije graficka karta nego je graficko/audio karta , mozda i graficko/video/fft karta

Bilo bi dobro kad ne bi sirio FUD po forumu. :trust:

Graficka karta ne moze da radi nista vezano za zvuk jer je kolje latencija i jer nema double precision floating point koji ceo audio pipeline i svi VST pluginovi i instrumenti koriste.

Evo da vas podsetim da je septembra 2004 izvesna firma BionicFX najavila obradu zvuka preko NVIDIA GPU... a sad sami pogledajte sta smo dobili 4 godine kasnije -- http://www.bionicfx.com/

genuine · 13.05.2008

fp32 ima dovoljnu preciznost za int16 posto je mantisa 23 bita
fp32 nema dovoljnu preciznost za int24 , ali fp64 ima
cuda podrzava fp64 tako da ne znam sta je problem...
radi kroz emulaciju, kad izadje hardware radice normalno tako da... audio gresis da ne moze

kada govorimo o latencijama zvuka takodje ni cpu ne moze nista, jedino sto moze je dsp u zvucnoj i to je to.. ali dobro znas da ne govorimo o realtime zvuku vec o postprodukciji

SOCOM · 13.05.2008

http://www.benchmark.co.yu/forum/showthread.php?t=164302
Bot je lepo rekao, a shta vi gospodo kazete?😀

Nedjo · 13.05.2008

audiofreak je napisao(la):
Znaci ako nisam jedno deset puta napisao Larrabee je GPU onda nista nisam napisao u ovom threadu! :wall:

Pa prijatelju bas u tome je problem. Ti to tvrdis, a Intel shiri slajdove okolo koji stosta kazu, smao ne kazu da je Larrabee GPU!

Evo iskreno, kako sam ja ukapirao Larrabee: 8-12 Silverthorn coreova oko G45 grafike, sa shareovanim L3 cacheom sa nehalema... e sad da bi to cudo naterali da radi grafiku brzinom jednog GeForcea 8600GT njima ce trebati VooDoo magija od kompajlera, a najbolji ljudi koji pisu takve stvari su i dalje u NVIDIA-i i ATI-ju, jer oni niti imaju cenu, niti dobijaju otkaze 😉

vi znamo da Intel ni dan danas nema dobru softversku podrsku za svoje IGP-ove i svi znamo da su "reinventing" procesiranja na ovakav nacin najavljivali za Itanium i svi znamo sta je posle bilo!

Ko god ocekuje Larrabee u svojim gejmerskim zverima, iduce godine, grdno se prevario, a ko god ocekuje Larrabee u svojim sistemima za razvoj aplikacija u medicinske svrhe, slobodno moze da se nada da ce bolje raditi nego CUDA na GT200 ili CTM na R700 😉

genuine · 13.05.2008

Slazem se da je emulacija spora i mozda i ne bude radilo mnogo brze od cpu-a ali je stvar samo u tome da programeri treba da se upute u gpgpu computing kako nvidijin tako i atijev jer otvara vrata za puno mogucnosti.
Recimo eto primer je holter ekg kojim sam se toliko bavio , i to je oko 1GB podataka koji gpu moze da isfiltrira u delicu sekunde + dodatna analiza... ako pogledate koliko recimo nvidija imaju jezgara i da su ona optimizovana za matricno - vektorske operacije onda je sve jasno ko dan. To je recimo nesto sto cu da iskoristim.
Drugi primer je opet obrada signala bilo kakve prirode, slika , zvuk, video sta god...
Znaci stvar je da ako je covek programer a postoji prilika za tako nesto zasto da je ne iskoristi. Time bi znatno podigao kvalitet svog proizvoda a i markentiski bi izgledalo extra tako da ne vidim u cemu je tu problem. Sada treba gledati na gpu kao sto se nekada gledalo na matematicki procesor kao eksternu jedinicu sa razlikom da integracija oba u jedno je jako komplikovana i nepotrebna jer se gubi na paralelizmu ( postojanje sistemske i video memorije i nezavistan pristup istima od strane cpu-a i gpu-a )

Sto se tice medicinskih stvari ako je u pitanju rekonstrukcija slika sa MRI-a onda opet larabi nema sta da trazi u odnosu na gpu... za neke druge stvari verovatno da ce biti superiorniji. Problem je kako ce da odrzavaju jezgra zauzetim... 4 niti koje rade i blokiraju se na memoriji i sta onda , idle? Tu je prednost gpu-a

Intel ne bi isao u ovaj marketing oko gpu-a da nije zabrinut za svoje proizvode. GPU napreduje mnogo brze od cpu-a i pojesce ga ako nesto intel ne preduzme...

undefined · 13.05.2008

A šta ako ipak u prvoj verziji intel batali DX10 i igre i napravi nešto što bi na primer u rendanju dralo Teslu/Quadro/FireŠtaVeć. Jednostavno ne bih toliko potcenjivao Intel.

Nedjo · 13.05.2008

undefined je napisao(la):
A šta ako ipak u prvoj verziji intel batali DX10 i igre i napravi nešto što bi na primer u rendanju dralo Teslu/Quadro/FireŠtaVeć. Jednostavno ne bih toliko potcenjivao Intel.

mislim da ga niko ne podcenjuje, jednostavno na jednoj strani imamo konkretne proizvode iz ATI-ja i NVIDIA-e koji melju DX i OGL i sve brze koracaju ka non-graphics primenama kroz CUDA i CTM inicijative. S druge strane imamo "Slideware" koji ocigedno svako moze da tumaci na svoj nacin.

ja nemam sumnje da Intel prvenstveno cilja na profi trziste sa larrabeeije, obzirom da NVIDIA na njemu dere sa marginama od preko 90%, ali jednostavno ne mogu da vidim sta tacno Intel ima da pruzi tom trzistu.

nadam se jednom Audiovom "za neupucene" postu, u kome bi nam svima mozda mogao razjasniti koje to benefite Larrabee treba da donese.

BTW
Tesla i FireStream nisu namenjeni rendanju!

kUdtiHaEX · 13.05.2008

audiofreak je napisao(la):
Ajde kutija molim te tarabi ovo, nemam vise snage da se objasnjavam sa nekim ko odbija da shvati neke osnovne stvari.

Zao mi je ali ne mogu da uslisim tvoju molbu 🙂
Bolji thread skoro nisam citao (sem onog u kojem peglas overklokere) a i cenim da je jako poucan za siru populaciju (za mene jeste, stalno ga pratim).

Zao mi je sto si dobio warn (ne, nisam ja) - keep writing!

audiofreak · 13.05.2008

genuine je napisao(la):
fp32 ima dovoljnu preciznost za int16 posto je mantisa 23 bita
fp32 nema dovoljnu preciznost za int24 , ali fp64 ima
cuda podrzava fp64 tako da ne znam sta je problem...
radi kroz emulaciju, kad izadje hardware radice normalno tako da... audio gresis da ne moze

kada govorimo o latencijama zvuka takodje ni cpu ne moze nista, jedino sto moze je dsp u zvucnoj i to je to.. ali dobro znas da ne govorimo o realtime zvuku vec o postprodukciji

Ti ne znas ocigledno nista o obradi zvuka i produkciji uopste.

1. 16-bit audio se ne koristi u studijskoj produkciji, koristi se 24/96
2. CUDA podrzava fp64 kroz emulaciju koja radi preko CPU
3. Nece raditi normalno nego samo offline i trebace dve karte kao sto i inace treba za CUDA
4. Ne nego upravo govorimo o realtime zvuku

CPU je taj koji opsluzuje interrupte zvucne karte i omogucava <2ms latenciju preko ASIO. CPU je taj koji radi reverb preko konvolucije, CPU je taj koji radi softversku sintezu zvuka u VST instrumentima, itd. GPU jednostavno nema dovoljno nisku latenciju za to niti ce je ikad imati dokle god ne bude direktno vezan na sistemski bus.

Nedjo je napisao(la):
mislim da ga niko ne podcenjuje, jednostavno na jednoj strani imamo konkretne proizvode iz ATI-ja i NVIDIA-e koji melju DX i OGL i sve brze koracaju ka non-graphics primenama kroz CUDA i CTM inicijative. S druge strane imamo "Slideware" koji ocigedno svako moze da tumaci na svoj nacin.

Koracaju u mestu vec par godina ako mene pitas.

Nedjo je napisao(la):
nadam se jednom Audiovom "za neupucene" postu, u kome bi nam svima mozda mogao razjasniti koje to benefite Larrabee treba da donese.

Moram prvo da ispravim samog sebe -- Larrabee nije samo GPU.

Intel vice president Steve Smith emphasized that Larrabee is not just a GPU, but a multi-core die capable of any stream processing task.

Takodje se pominje da ce imati AVX (256-bit SIMD koji sam pomenuo u drugom threadu) sto bi omogucilo obradu 4x fp64, 8x fp32 po instrukciji.

Evo uostalom teksta pa procitajte ko nije : link

Evo i detalja iz zvanicnog press releasea:

Larrabee Architecture for Visual Computing.
With plans for the first demonstrations later this year, the Larrabee architecture will be Intel’s next step in evolving the visual computing platform. The Larrabee architecture includes a high-performance, wide SIMD vector processing unit (VPU) along with a new set of vector instructions including integer and floating point arithmetic, vector memory operations and conditional instructions. In addition, Larrabee includes a major new hardware coherent cache design enabling the many-core architecture. The architecture and instructions have been designed to deliver performance, energy efficiency and general purpose programmability to meet the demands of visual computing and other workloads that are inherently parallel in nature. Tools are critical to success and key Intel® Software Products will be enhanced to support the Larrabee architecture and enable unparalleled developer freedom. Industry APIs such as DirectX™ and OpenGL will be supported on Larrabee-based products.

Press release je ovde : link

Evo jos zanimljivog stiva : link (pasus koji pocinje sa "In 2004 we decided").

Nedjo · 13.05.2008

Znaci larrabee nije CPU, nije ni GPU... Intel ocigledno nece da koristi naziv Stream processor jer ga 'vidija i AMD koriste... mislim da oni jos ima da bruse i shmirglaju svoju PR pricu... bas zato me i ne zanima citanje njihovih saopstenja, ocekivao sam da ti sazvaces materiju i na pristupacan nacin da je izlozis ovde...

Sto se tice koracanja, znas i sam koliko je sirok akademski pokret iza citave price GPGPU-a i mozda su koraci mali, ali ide se po jasno definisanoj stazi... s druge strane citava prica s Larrabeejem je setnja kroz totalno nepoznat teren koji Intelov PR, logicno, nastoji da nacrta kao zlatnim ciglama poplocanu stazu u zemlji OZ.

genuine · 13.05.2008

majti konvolucija, zaboravio si FIR i IIR. malo mi se tvoji tajminzi ne svidjaju, moji se malko razlikuju
1. desi se IRQ,
2. cpu ga primi iskace po tabelama i par us kasnije je u tvojoj prekidnoj rutini
3. ona kaze zvucnoj da nastavi dalje i da je sve ok i postavi dpc poziv
4. dpc se pozove u neko vreme dogledno za scheduler i on obavi majti konvoluciju reda o(n^2)
5. kad zavrsi sa konvolucijom mora opet u kernel mod da skace preko sysenter ili cega vec da bi drajver zvucne znao sta treba da izbaci napolje tako da tih 2ms je mozda najbolji slucaj. mozda moze ovo da se nekako isforsira windows-u iza ledja ali opet ako hoces da radis obradu u prekidnoj rutini moze da te prekine prekid veceg prioriteta. Ovo sam napisao kao da traje 100 godina ali je jako brzo osim DPC poziva koji je kljucna stvar i zavisi od schedulera...

a druga stvar je da 2ms nije realtime tako da u startu neznam sto sam ovo ni pisao. ljudi kao jordan rudess sviraju 1/32 tako da 2ms verovatno i da mogu da osete...

ono sto cpu moze da radi je da generise banku instrumenata ( semplova ) i da ih posalje zvucnoj a ona da radi to sto si ti pricao samo u hardware-u... probao sam koliko je realtime recimo abelton live ili kako se vec zove i trudi se al nije..

pa oni kazu da larabi nije procesor, ti kazes da je gpu a intel kaze da kupovinom gpu -a ne dobijas nista, zakljucak kupovinom larabija ne dobijas nista 🙂 nije moje misljenje samo zakljucivanje na intel bazi

audiofreak · 13.05.2008

Nedjo je napisao(la):
Znaci larrabee nije CPU, nije ni GPU... Intel ocigledno nece da koristi naziv Stream processor jer ga 'vidija i AMD koriste... mislim da oni jos ima da bruse i shmirglaju svoju PR pricu... bas zato me i ne zanima citanje njihovih saopstenja, ocekivao sam da ti sazvaces materiju i na pristupacan nacin da je izlozis ovde...

Pa vec sam dovoljno toga rekao ali hajde posto ne razumes za tebe cu da ponovim jos jednom:

Larrabee + AVX + Intel kompajler + performance bibilioteke (IPP, MKL) = visoke performanse u bilo kom zadatku bio on fp32 ili fp64. Jednostavnije od toga ne moze.

Nedjo je napisao(la):
Sto se tice koracanja, znas i sam koliko je sirok akademski pokret iza citave price GPGPU-a i mozda su koraci mali, ali ide se po jasno definisanoj stazi...

Pa ta staza konvergira ka CPU jer jednostavno GPU ne moze da resi mnoge probleme na optimalan nacin zbog toga sto je njegova programabilnost jos uvek usko specijalizovana.

Sta mislis ko ce pre stici na cilj, onaj ko ima GPU i malim koracima ide ka CPU ili onaj ko ima CPU i velikim koracima grabi ka GPU?

Nedjo je napisao(la):
s druge strane citava prica s Larrabeejem je setnja kroz totalno nepoznat teren koji Intelov PR, logicno, nastoji da nacrta kao zlatnim ciglama poplocanu stazu u zemlji OZ.

A da se ovde prica o Fusion-u onda ne bi bilo tako? :trust:

@genuine:
< 2ms je kasnjenje za monitoring, to uopste ne smeta za sviranje/nasnimavanje u realnom vremenu sa previewom svih efekata i instrumenata. Sinteza zvuka je odavno prevazisla fazu hardware wavetable synth-ova i soundfontova i sada se koriste kompleksniji softverski sintisajzeri sa fizickim modeliranjem karakteristike instrumenata. Uostalom, ima sigurno neko ko se time bavi pa nek ti on objasni detaljnije ako ga ne mrzi.

Mozes i sam da probas da radis sa Cubaseom i VST sintisajzerima poput The Grand, Atmosphere, Trilogy, Stylus, HalionStrings, VirtualGuitarist, Arturia Moog Modular, Edirol HQ Orchestral ili SuperQuartet, Native Instruments B4 i naravno sa reverbom poput Voxengo Pristine Space. Trebace ti ASIO V2 kompatibilna karta, trebace ti brzi diskovi i dosta RAM-a, a iznad svega procesorske snage. Da uopste ne pominjemo sta biva ako hoces da koristis Vienna Symphonic Library.

Nedjo · 14.05.2008

audiofreak je napisao(la):
Larrabee + AVX + Intel kompajler + performance bibilioteke (IPP, MKL) = visoke performanse u bilo kom zadatku bio on fp32 ili fp64. Jednostavnije od toga ne moze.

Uuu pa ako ne moze jednostavnije od toga, onda ce Intel zaista imati problem da objasni sta je Larrabee... u svakom slucaju slazes se da Larrabee nije ni CPU ni GPU.

Pa ta staza konvergira ka CPU jer jednostavno GPU ne moze da resi mnoge probleme na optimalan nacin zbog toga sto je njegova programabilnost jos uvek usko specijalizovana.

Definitivno zavisi s kog stanovista gledas. Meni se nekako cini da je lakse modifikovati GPU da lici na CPU, nego CPU da lici na GPU.

Sta mislis ko ce pre stici na cilj, onaj ko ima GPU i malim koracima ide ka CPU ili onaj ko ima CPU i velikim koracima grabi ka GPU?

Pa ovde i jeste kljucno pitanje dimenzija tih koraka. Sa raspolozivim informacija jedini validan zakljucak je da ovi sto imaju GPU koracaju vecim koracima u odnosu na ove, pardon ovog, sto ima CPU.

A da se ovde prica o Fusion-u onda ne bi bilo tako? :trust:

Ako ces realno, ovo je nicim izazvana insinuacija i stvarno nema razloga da je potezes, pa posle da krene licitiranje na konto moje objektivnosti.

To sto ja svoje misljenje baziram na kolicini informacija koje mogu da protumacim u Slidewareu, ne znaci da treba da me postapas, narocito, kada te ljudski pitam za razjasnjenje. Ne ide ti to na cast!

audiofreak · 14.05.2008

Nedjo je napisao(la):
Definitivno zavisi s kog stanovista gledas. Meni se nekako cini da je lakse modifikovati GPU da lici na CPU, nego CPU da lici na GPU.

Izgleda da cemo opet poceti sa auto-analogijama...

Znaci ti smatras da je lakse prilagoditi motor Formule 1 za gradsku voznju tesnim krivudavim ulicama, nego recimo motor Mazde RX-8 za voznju po stazi za Formulu 1? E vidis, ja se ne slazem sa tim.

Nedjo je napisao(la):
Pa ovde i jeste kljucno pitanje dimenzija tih koraka.

U proslom postu si rekao:

Nedjo je napisao(la):
Sto se tice koracanja, znas i sam koliko je sirok akademski pokret iza citave price GPGPU-a i mozda su koraci mali, ali ide se po jasno definisanoj stazi...

A sad kazes:

Nedjo je napisao(la):
Sa raspolozivim informacija jedini validan zakljucak je da ovi sto imaju GPU koracaju vecim koracima u odnosu na ove, pardon ovog, sto ima CPU.

Ostaje jos ti da nam se odlucis jesu li mali ili veliki ti koraci?

Ja sam se vec odlucio jer GPGPU pratim vec duze vreme i po mom misljenju ti koraci su skoro pa tapkanje u mestu i svode se uglavnom na otkrivanje tople vode.

Nedjo je napisao(la):
Ako ces realno, ovo je nicim izazvana insinuacija i stvarno nema razloga da je potezes, pa posle da krene licitiranje na konto moje objektivnosti.

Pa zasto onda kazes da Intel idealizuje Larrabee i ispadas pristrasan? Koliko ja znam Intel PR nije nigde tvrdio da ce Larrabee biti bolji od bilo cega, samo da ce imati siroku primenu zahvaljujuci x86 kompatibilnosti i dobre performanse.

Nedjo je napisao(la):
To sto ja svoje misljenje baziram na kolicini informacija koje mogu da protumacim u Slidewareu, ne znaci da treba da me postapas, narocito, kada te ljudski pitam za razjasnjenje. Ne ide ti to na cast!

Ni tebi ne ide na cast sto nazivas to Slideware iako se prvi semplovi ocekuju vec u Q4 2008. Uostalom, gledacemo se ovde i u 2009 pa cemo videti ko je bio u pravu, nema smisla mlatiti praznu slamu dalje.

genuine · 14.05.2008

Larabi je u stvari mit. Cpu nije dovoljno brz, gpu nije dovoljno generalan, larabi je generalizovani gpu koji nema jedinice gpu-a vec je kao multicore procesor znaci deo zelja nvidije i intela s tim sto je intel pravi. Ko ce pre, dal nvidija da generalizuje gpu ili intel da specijalizuje procesore..hm...
Videcemo sta ce intel da uradi za dve godine, ali mene vise zanima sta ce nvidija da izbaci za dve godine posto mnogo brze radi na arhitekturi od intela.

Nedjo · 14.05.2008

audiofreak je napisao(la):
Izgleda da cemo opet poceti sa auto-analogijama...

Znaci ti smatras da je lakse prilagoditi motor Formule 1 za gradsku voznju tesnim krivudavim ulicama, nego recimo motor Mazde RX-8 za voznju po stazi za Formulu 1? E vidis, ja se ne slazem sa tim.

Tesne krivudave ulice - Monako... F1 motor u automobilima - Ferrari, MClaren F1...

Ostaje jos ti da nam se odlucis jesu li mali ili veliki ti koraci?

Da parafraziram sebe: GPGPU putem se koraca malim koracima, ali su IMHO Intelovi jos manji u odnosu na NVIDIA-ine i ATi-jeve

Ja sam se vec odlucio jer GPGPU pratim vec duze vreme i po mom misljenju ti koraci su skoro pa tapkanje u mestu i svode se uglavnom na otkrivanje tople vode.

Ako ti tako kazes, ono sto je cinjenica da su ti mali koraci dali neke konkretne rezultate (F@H klijent, recimo), dok s druge strane imamo samo Slideware

Pa zasto onda kazes da Intel idealizuje Larrabee i ispadas pristrasan?

prvo: na koju foru zakljucujes da sam pristrasan ako kazem da intel idealizuje Larrabee?!
drugo: da on ga idealizuje, jer tvrdi da ce Larrabee da sahrani resterizaciju i da ce da donese revoluciju na polju procesiranja grafike i na GPGPU polju!
Ako konstatovanje ovih cinjenica nazivas pristrssnoscu s moje strane, onda ne znam o cemu imamo da pricamo?!

Ni tebi ne ide na cast sto nazivas to Slideware iako se prvi semplovi ocekuju vec u Q4 2008. Uostalom, gledacemo se ovde i u 2009 pa cemo videti ko je bio u pravu, nema smisla mlatiti praznu slamu dalje.

pfff, ti meni na cast prebacujes zato sto ja citiram jensena i Kirka povodom Intelovog razmetanja larrabee slajdovima!?

Kako to u opste moze da se poredi sa mojom opaskom tebi gde ti licno mene optuzujes za pristrasnost izmisljajuci kako bih ja komentarisao da se pise o Fusionu?!

Zar je moguce da ti toliko licno shvatas sve sto je u vezi sa intelom?!?

audiofreak · 14.05.2008

Nedjo je napisao(la):
Tesne krivudave ulice - Monako... F1 motor u automobilima - Ferrari, MClaren F1...

Da, a potrosnja goriva, i zamena motora posle svake voznje?

Nedjo je napisao(la):
Ako ti tako kazes, ono sto je cinjenica da su ti mali koraci dali neke konkretne rezultate (F@H klijent, recimo), dok s druge strane imamo samo Slideware

Pa zasto ti poredis F@H klijent ATI-jev sa "Slideware"?!? Koliko ja znam ovde je rec o NVIDIA i Intel, a NVIDIA je ta koja posle svog tog silnog dugogodisnjeg zalaganja za GPGPU JEDINA JOS UVEK NEMA F@H KLIJENT.

Nedjo je napisao(la):
drugo: da on ga idealizuje, jer tvrdi da ce Larrabee da sahrani resterizaciju i da ce da donese revoluciju na polju procesiranja grafike i na GPGPU polju!

Ja verujem da ce unaprediti postojece stanje, da li ce biti revolucija ne znam, mozda pre evolucija ali sigurno nece samo prdnuti u cabar kao sto to izgleda vecina ovde misli. Uloziti tolike resurse i raditi 4 godine (i vise) na necem da bi to nesto ispalo lose moras priznati da nema mnogo smisla.

Nedjo je napisao(la):
Kako to u opste moze da se poredi sa mojom opaskom tebi gde ti licno mene optuzujes za pristrasnost izmisljajuci kako bih ja komentarisao da se pise o Fusionu?!

Ja nisam pominjao tebe licno, samo sam rekao da znam da Fusion niko ovde ne bi zvao "Slideware".

kovacm · 15.05.2008

bitno da ste vi Cell iskljucili iz svake dalje price kao da ne postoji a najdalje je otisao na ovu temu...

ali dobro ono sto mene interesuje, vec sam pitao u drugom thread-u:
---------
ono sto bih ja sad voleo je da mi neko objasni koje su i na koji nacin prednosti GPU za GP?!?

za Cell sam procitao gomilu stranica i mogu reci da razumem odakle mu brzina ali na koji nacin je GPU brzi 10x od sadanjih procesora? i koja su ogranicenja?

svi se "frljaju" nekim brojkama ali koja je prednost, odnosno odakle prednost GPU nad CPU??

koliko GPU treba taktova za neku naredbu a koliko CPU. ...? koja su ogranicenja GPU...? ako imate neki link tipa chip-architect.com na ovu temu bio bih vise nego zahvala! 🙂

DeanXP · 15.05.2008

yooyo je napisao(la):
Ajde nek neko napravi poredjenje arhitektura.. npr 3870 i Larrabee. 3870 je 5-way superskalarna sprava a kakav je larrabee po tom pitanju? Da li ce svako jezgro da izvrsava poseban pogram ili ce jezgra da imaju zajednicki IP (instr. pointer) i izvrsavace identican program?

Arhitektura

Po pitanju instruction pointera (IP) tj. nezavisnih thread-ova* i izvrsnih jedinica:

-G80 moze da izvrsava 16 nezavisnih programa: Sastoji se od 8 cluster-a. Cluster se sastoji od 2 "Streaming Multiprocessor-a - SM" (nVidia-ina terminologija). Svaki SM poseduje jedan IP. Ukupno postoji 16 SM-a, dakle 16 IP-a.
Jedan SM poseduje SIMD jedinicu od 8 ALU-a tj. SIMD je 8-wide.

-RV670 moze da izrsava 8: Ima 4 SIMD Array-a. Jedan SIMD Array ima 2 IP-a - Ukupno 8.
Svaki SIMD Array cini 5 * 16-wide SIMD.

-Larrabee bi se sastojao od 16 x86 jezgara. Svako jezgro je 4-way SMP tj. ima 4 IPa. 16*4 = 64 threada.
Jedno jezgro ima dve 16-wide SIMD jedinice.

*Koliko sam primetio nVidia i ATI kao thread-ove broje i paralelnu obradu pixela. Medjutim, kako se nad tim pixelima izvrsava ista instrukcije tj. prate isti IP, ja bih se pod terminom "thread" ogranicio na nezavisne instruction pointere.

Terminologija

Jedna zanimljiva stvar u ovoj GPU vs. CPU prici je terminologija. Kako se danas u stvari definise GPU? Mogu se staviti jedan pored drugog TNT2 i G80. Oba idu pod nazivom "GPU", a razlika izmedju njih je toliko drasticna da stavljati ih u isti kos postaje smesno.
TNT2 ima jedan zadatak i to je to. G80 nije usko ogranicen na jedan jedini zadatak i samim tim je vise od obicnog "Graphics processing unit-a". Tu dolazi na scenu GPGPU. Da li se sad GPU pravi za grafiku, a opsta primena je tu kao posledica ili se GPU pravi sa opstom primenom kao jednim od ciljeva? Ako je ovo drugo da li ga uopste ima smisla zvati "graphics sta god" ili je postao nova kategorija?

Generalizacija GPUa, Larrabee, Fusion - sve su to novi koncepti koje tek treba ispitati i hezahvalno je udarati na njih pecat, pogotovo ne pecat zastarele terminologije.

Primena

Mislim da je potrebno tacno odrediti dve stvari:
1) Da li se prica u kontekstu igara ili opste primene?
2) O kom trzistu se radi? Desktop/Mobile ili Server/HPC?

Koliko sam primetio u ovom thread-u su se dosta pomesale ove kategore, a ne moze da se sudi isto za sve.

Na osnovu dosad dostupnih Larrabee informacija moje misljenje je ovakvo, po kategorijama:

1) Desktop - igre
Larrabe ce imati specijalizova jedinice za rasterizaciju uz mini x86 jezgra. Mnostvo mini x86 jezgara bi uz dobru custom design logiku i odlican proizvodni proces iz Intela mogla imati vrlo dobru sirovu FLOPS snagu (1.28 TFLOPSa (single precision) za inicijalni 16-jezgarni Larrabee). Medjutim, ono od cega zaista zavise gaming performasne su specijalizovane jedinice i driver. Po dosadasnjim integrisanim resenjima bi se reklo da im taj deo ne ide uopste dobro. Ko zna, ako zaposle neke iskusne ljude iz te oblasti i uloze masu resursa u razvoj DirectX i OpenGL drivera, mozda nas iznenade. Licno sam skeptican.

2) Server/HPC - opsta primena
Ovo je potencijalno najbolje mesto za Larrabee. Ovde bi cak najbolje isao bez graficki specijalizovanih delova. U planu je verzija Larrabee-a za socket uz QuickPath cache coherent linkove (licno smatram da je ova verzija Larrabee-a prethodila "on card via PCIe" verziji). Tako se dobija najlaksa integracija u sistemima od par hiljada procesora. Sistem koji se sastoji od Larrabee i Sandy Brigde procesora koji su povezani istim QPI linkovima bi bio super za HPC trziste (think Cray supercomputer). Larrabee ne bi imao nikakva ogranicenja programabilnosti jednog GPGPU-a. Ovo bi bio jedan sjajan number cruncher!

3) Desktop - opsta primena
Mozda u nekoj kasnijoj inkarnaciji kao CPU sa heterogenim jezgrima. Par fat Sandy Bridge jezgara, mnostvo mini Lerrabee jezgara, pa cak mozda i koje Atom jezgro (za power saving pri malim operecenjima) - sve to na jednom die-u (za par godina sa sitinijim procesom).

4) Server/HPC - igre
Ocigledno ova kategorija bas ne ide 🙂

audiofreak · 15.05.2008

Odlican post DeanXP. Vrlo sistematican, sto meni moram priznati bas ne ide kad moram da se rvem sa raznim likovima istovremeno ovde na benchu.

DeanXP je napisao(la):
Po dosadasnjim integrisanim resenjima bi se reklo da im taj deo ne ide uopste dobro. Ko zna, ako zaposle neke iskusne ljude iz te oblasti i uloze masu resursa u razvoj DirectX i OpenGL drivera, mozda nas iznenade. Licno sam skeptican.

Ja mogu samo da kazem da sam nacuo da se ocekuje da uskoro izadje beta OpenGL 2.0 drajver za GMAX3100. Cip koji radi na svega 667 MHz, koristi sistemsku memoriju i ima svega 1 VP i 8 SP po mom misljenju sasvim solidno radi s obzirom na sva ta ogranicenja.

G!!! · 15.05.2008

sve u svemu svi su skeptichni da li ce imati upotrebnu vrednost za igre, zbog kojih se inache kupuju grafichke 🙂

yooyo · 15.05.2008

@DeanXP:
Bravo.. svaka cast.
Sto se tice dfinicije sta je thread ne bih se skroz slozio sa tobom. Mislim da je thread u GPU malo drugaciji.. U principu, vise procesora dele isti program i isti IP ali taj program ima razlicite ulazne parametre. Sa jedne strane, svi dele isti IP a sa druge rade sa razlicitim podacima. Medjutim, rezultat rada svih tih procesora je razlicit, tj posao koji obavljaju je vesestruko paralelizovan.

Znaci i jeste thread i nije thread.

Nisam znao da ce svako larrabee jezgro imati po 4 hw threada. Izgleda da ce to biti lepa sprava.. da li ce imati hw thread scheduler? Mislim.. treba ta jezgra stalno drzati zaposlena. Koliko ce kostati promena procesa? Mislim da NVidia ima jos neke trikove.. npr. Kada se radi fetch iz texture to je operacija koja moze da potraje, giga-thread engine ce tom procesoru odmah dati drugi posao, a kada rezultat fetch instrukcije stigne taj proces ce ponovo doci na red za izrsavanje.. E sad.. nisam siguran da li ce taj thread moci da se nastavi u drugom SM ili ostaje u svom SM-u.

Ovo bi se moglo posmatrati kao kada bi x86 instrukcija [bold]mov reg, mem[/bold] moga da izazove promenu threada dok ne stigne rezultat iz memorije. U tom slucaju bi procesor bio maksimalno iskoriscen. Ako je podatak u cache-u onda mu treba 2-3 cycle-a da dodje do registra a ako je u memoriji onda vise. Neznam koliko ciklusa treba G80 da bi procesor promenio thread. Takodje CPU ima OoO izvrsavanje koji instrukcije razlaze

Shvatam da su sitni trikovi koji se koriste radi povecanja efikanosti specificni za sve proizvodjace. Pitanje je koliko Intel trikovi mogu da budu primenjivi u GPU svet?

Generalno.. mogao bih doneti ovakav zakljucak:

Strategija za CPU: Kako naterati par threadova da rade brzo?
Taktika je smanjivanje latencije. Veliki cache da bi bila veca verovatnoca "pogotka", instrukcijski i data prefetch i spekulativno (OoO) izvrsavanje. Limit je bandwidth. Siroka oblast primene, relativno mala racnska moc.

Strategija za GPU: Kako naterati mnooogo threadova da rade brzo?
Taktika je maksimizovaati propusnu moc. Mali cache (promasaj je cest slucaj), paralelizam od preko 1000 threadova, pipelining. Uska oblast primene, velika racunska moc.

Kako li ce Intel sa Larrabee-em da pomiri ova dva sveta?

Nvidia tvrdi - CPU je mrtav

Čuven

Čuven

Banned

Čuven

Slavan

Slavan

Čuven

Slavan

Banned

Slavan

Čuven

Čuven

Slavan

Slavan

Čuven

Super ridža

Banned

Čuven

Slavan

Banned

Čuven

Banned

Slavan

Čuven

Banned

Čuven

Čuven

Banned

Čuven

Čuven