Nvidia tvrdi - CPU je mrtav

Nedjo · 15.05.2008

yooyo je napisao(la):
Strategija za CPU: Kako naterati par threadova da rade brzo?
Taktika je smanjivanje latencije. Veliki cache da bi bila veca verovatnoca "pogotka", instrukcijski i data prefetch i spekulativno (OoO) izvrsavanje. Limit je bandwidth. Siroka oblast primene, relativno mala racnska moc.

OoO jezgro=kompleksnost=dimenzije=mali broj jezgara...

audiofreak · 15.05.2008

Nedjo je napisao(la):
OoO jezgro=kompleksnost=dimenzije=mali broj jezgara...

Koliko sam ja cuo Larrabee ce biti in-order jezgra sa kratkim pajplajnom.

DeanXP · 15.05.2008

yooyo je napisao(la):
Sto se tice dfinicije sta je thread ne bih se skroz slozio sa tobom. Mislim da je thread u GPU malo drugaciji.. U principu, vise procesora dele isti program i isti IP ali taj program ima razlicite ulazne parametre. Sa jedne strane, svi dele isti IP a sa druge rade sa razlicitim podacima. Medjutim, rezultat rada svih tih procesora je razlicit, tj posao koji obavljaju je vesestruko paralelizovan.

Znaci i jeste thread i nije thread.

Da, otvoreno je za tumacenje i bas sam iz tog razloga posebno naveo sta podrazumevam pod thread-om.
Koliko sam video, nVidia uvodi sledece pojmove za CUDA: grid, block i thread.
-Problem se prvo deli u sekvencijalne delove - grids. Oni ne mogu paralelno da se izvrsavaju.
-Grid se deli na nezavisne paralelne block-ove koji mogu paralelno da se izvrsavaju i svaki block cini nezavisan program (dakle svakom je potreban po jedan IP).
-Block se deli na paralelne elemente. Izvrsavalje razlicitih podataka koji prate isti IP - nVidia ovo naziva thread-om.

E sad, stvar je u tome sto izvrsavanje istih instrukcija nad razlicitim podacima u stvari predstavlja SIMD (Single Instructon Multiple Data) - npr. nad 8 razlicitih podatak se izvrsava ista instrukcija. NVidia svaki podatak racuna kao thread.
S druge strane, MIMD (Multiple Instruction Multiple Data) izvrsavanje koje dozvoljava nezavisne poslove je ono sto se tradicionalno podrazumevam pod "thread-om". NVidia ovo naziva block.

yooyo je napisao(la):
Ovo bi se moglo posmatrati kao kada bi x86 instrukcija [bold]mov reg, mem[/bold] moga da izazove promenu threada dok ne stigne rezultat iz memorije.

Bas je to radio P4 sa hyperthreading. Jedan thread radi dok drugi ceka.
Pored toga, out-of-order izvrsavanje ovo regulise i unutar jednog thread-a.

Dok ce Larrabee jezgra biti in-order, ona bi mogla imati load-lookahead koji je relativno lako realizovati i bez potpunog OoO jezgra. In-order procesor sa load-lookahead odrzava redosled svih instrukcija sem load-ova, koji mogu vanredno da se izvrsavaju. Load se izvrsava sto pre kako bi amortizovao memory latency.

yooyo je napisao(la):
Strategija za CPU: Kako naterati par threadova da rade brzo?
Taktika je smanjivanje latencije. Veliki cache da bi bila veca verovatnoca "pogotka", instrukcijski i data prefetch i spekulativno (OoO) izvrsavanje. Limit je bandwidth. Siroka oblast primene, relativno mala racnska moc.

Rekao bih da je ovo strategija za klasicna fat CPU jezgra, dok nova mini jezgra koja cine Larrabee mnogo blize prate ovu strategiju koju si predlozio za GPU. A postoje i mini jezgra tipa Atom, koja imaju treci cilj.

yooyo je napisao(la):
Kako li ce Intel sa Larrabee-em da pomiri ova dva sveta?

Larrabee definitivno ne moze da ih pomiri. To bi eventualno mogao procesor sa heterogenim jezgrima (2 ili vise razlicitih tipova jezgara). Mada ni takav procesor ne moze da zadovolji sve segmente podjednako.

Jovyland · 15.05.2008

😀

THE WAR OF WORDS that broke out between Nvidia and Intel has AMD chuckling along from the sidelines.

“One says the CPU is not important, the other says the GPU is not important. The beauty of AMD is that we provide a balance with a strong CPU and a strong GPU - the company best tailored to provided a balanced PC,” puffed Giuseppe Amato, AMD’s technical director of sales and marketing in EMEA. “We hope we see some gain from the fight these two are having together.”

LINK

gx-x · 15.05.2008

rofl :d

ruku na srce, istina je to sto govore, ali nije tesko biti u top 10 kad imas skupa dva igraca...Samo, u ekstremnoj situaciji gde bi recimo svi koristili Larrabee AMD bi skroz puko jer nam GPU od njih ne treba, ni CPU takodje. Ako nvidia izbaci CPU (dakle rekoh, u nekoj ekstremnoj i fiktivnoj situaciji) iz igre, AMD opet propada. Bolje da cute 😀

Nedjo · 16.05.2008

gx-x je napisao(la):
rofl :d

ruku na srce, istina je to sto govore, ali nije tesko biti u top 10 kad imas skupa dva igraca...Samo, u ekstremnoj situaciji gde bi recimo svi koristili Larrabee AMD bi skroz puko jer nam GPU od njih ne treba, ni CPU takodje. Ako nvidia izbaci CPU (dakle rekoh, u nekoj ekstremnoj i fiktivnoj situaciji) iz igre, AMD opet propada. Bolje da cute 😀

i onda je mrmot zamotao cokoladicu... pfff

SeeBeen · 18.05.2008

Ufff brate, zamotaste ga sa tehnikalijama... Trebalo mi je 45 minuta da bih lepo procitao postove, clanke, konsultuvao Wikipediu... A trebace mi jos barem triput toliko da bih sve lepo skontao...
Moze li samo malkice jednostavnije za nas sa jeftinijim ulaznicama... 🙂

Jovyland · 18.05.2008

CooLa je napisao(la):
Ufff brate, zamotaste ga sa tehnikalijama... Trebalo mi je 45 minuta da bih lepo procitao postove, clanke, konsultuvao Wikipediu... A trebace mi jos barem triput toliko da bih sve lepo skontao...
Moze li samo malkice jednostavnije za nas sa jeftinijim ulaznicama... 🙂

Ja sam se trudio, ali sam digo ruke.🙂

genuine · 19.05.2008

Evo najbolji primer, imas 500 evra i hoces da se igras, da gledas filmove, da teras vistu, obradu slika sl Sta bi stavio u taj racunar od 500 evra od komponenata.... Pitanje vazi za sve sa foruma , moze i novi tread da se napravi. Bez monitora naravno...

p.s.
namena je gore navedena, ako neko kaze a baze podataka, raytracing, arhiviranje i sl.. ispada iz igre

gx-x · 19.05.2008

genuine je napisao(la):
Evo najbolji primer, imas 500 evra i hoces da se igras, da gledas filmove, da teras vistu, obradu slika sl Sta bi stavio u taj racunar od 500 evra od komponenata.... Pitanje vazi za sve sa foruma , moze i novi tread da se napravi. Bez monitora naravno...

p.s.
namena je gore navedena, ako neko kaze a baze podataka, raytracing, arhiviranje i sl.. ispada iz igre

look'n'stop + seba mods x2 leexher

SeeBeen · 20.05.2008

X2 4000+
TF770
9600GT
2x1Gb rama
160Gb HDD
Case
DVDRW

ikonoklast · 20.05.2008

gx-x je napisao(la):
look'n'stop + seba mods x2 leexher

Sta rece ovde ? 🙂

gx-x · 20.05.2008

pa to mu treba, ostalo je manje-vise nebitno 🙂 dobar firewall da mu racunar radi dok je na netu, dok je na netu i skida igre i filmove koje oce da igra/gleda stavi seba14 2x leecher klijent da moze da odrzava ratio ko covek sa ovim nasim ubogim netom. Ostatak je hardwer koji sam po sebi nista ne znaci 🙂 Eto, coola je naveo konfu koja je sasvim ok. Cak necu ni intel da potenciram iako bi mogao da udje u tu sumu.

IgorHW · 22.05.2008

GPU vs. CPU Upgrade
Ako vam se ne svidja test, don't shoot the messenger. 🙂

genuine · 22.05.2008

Larabi puca na dynamic branchingu u sejderima ako koristi 512bitne registre.. sta ako jedan verteks oce na jednu stranu a drugi na drugu, hm... da podelim registre pa nek putuju

Nedjo · 22.05.2008

genuine jesi li se prijavio: http://cudacontest.nvidia.com/index.cfm?action=contest.contest&contestid=2

😉

ovo je prilicno dobar zadatak, obzirom da je LAME jos na verziji 3.97alpha odustao od MT optimizacije jer se pokazalo da negativno utice na kvalitet zvuka... pa su se okrenuli eksploataciji performansi koje su donele nove verzije Intelovih kompajlera.

Prakticno MP3 kompresija danas je single threadovana 100% i bilo bi lepo videti da neko nadje CUDA resenje koje ce doneti ubrzanje, a nece negativno uticati na kvalitet na izlazu...

zeljko · 22.05.2008

jel ce GPU ubacivat 3D surround automacki prilikom reencodinga?

Northwood · 22.05.2008

Nedjo je napisao(la):
genuine jesi li se prijavio

onda bi bila namestaljka da neko iz firme dobije nagradu 😀
uvek me interesovalo zasto ne apdejtuju dalje LAME...

posto ne ispunjava uslove moze da pokusa za svoju dusu 😉

* Age 18 or older
* Resident in the United States or Canada
* Not a corporate or institutional entity
* Not an employee of NVIDIA, its affiliates, or members of their immediate families and/or households

audiofreak · 22.05.2008

genuine je napisao(la):
Larabi puca na dynamic branchingu u sejderima ako koristi 512bitne registre.. sta ako jedan verteks oce na jednu stranu a drugi na drugu, hm... da podelim registre pa nek putuju

To je problem kod GPU-a jer nema odgovarajuce instrukcije. Na x86 mogu da se vektorizuju i uslovi/poredjenja.

Takmicenje im je zakon, testiraju na Core 2 Duo E2180 pod Linux-om. :d

3MaJ · 22.05.2008

Арогантно је с њихове стране што мора да будеш из Америке да би могао да учествујеш. Ја баш скупио пар другара кад оно...
Но добро, какав конкурс, такво ће бити и решење.

genuine · 23.05.2008

Poenta testiranja na "slabom" cpu je da se pokaze da ti ne treba brz jer ce sve gpu da radi.

Yoti · 23.05.2008

Bas sve :d
:wave:

genuine · 23.05.2008

Sve sto koristi 80% tvog vremena za kompom kada ti cpu nije idle 🙂

Nedjo · 23.05.2008

ova vest me je podsetila na moju raspravu sa Audiom u vezi malih i velikih koraka na polju GPGPU-a:

http://www.pcper.com/comments.php?nid=5679

@genuine
jel se ovi momci zezaju ili ti stvarno radis za 'vidiju?

3MaJ · 23.05.2008

Ја знам да све више наших ради тамо, а и неки моји другари треба да иду овог лета на три месеца.

Nedjo · 23.05.2008

3MaJ je napisao(la):
Ја знам да све више наших ради тамо, а и неки моји другари треба да иду овог лета на три месеца.

to je fantasticna stvar!
ako mozes, molio bih te da mi bacis par detalja na PM!

genuine · 23.05.2008

pa trenutno "radim" kao intern na 6 meseci probno, za dalje ne znam nista..

audiofreak · 23.05.2008

genuine je napisao(la):
Poenta testiranja na "slabom" cpu je da se pokaze da ti ne treba brz jer ce sve gpu da radi.

Pre svega uopste nema poente ubrzavati mp3 enkodiranje:

Kod:

M:\Music\1-CD\Misija>gogo -b 256 -m s -q 0 "Unknown Artist - Unknown Title.wav"
encode Unknown Artist - Unknown Title.wav to Unknown Artist - Unknown Title.mp3
GOGO-no-coda ver. 3.11 (Jan 10 2003) is a mp3 encoder based on lame 3.88,
which is distributed under LGPL on http://www.mp3dev.org/mp3/ .
See http://member.nifty.ne.jp/~pen/ ,
    http://homepage1.nifty.com/herumi/gogo_e.html .
family 6:vendor Intel
extended instruction - MMX EMMX CMOV SSE SSE2 CLFLUSH
enabled extended instruction - MMX EMMX CMOV SSE SSE2 CLFLUSH
MPEG 1 layer III
{ 179477/ 179477} 100.0% (116.30x)  re:[00:00:00.00] to:[00:00:40.31]

116.30x je brzina u odnosu na realtime. Konkretno ovaj fajl od 788.7 MB (vreme trajanja 01h 18m 08s) je spakovan za svega 40 sekundi na E8200 (2.66GHz).

Da limitacija nije citanje sa diska verovatno bi to islo i brze jer zauzece procesora nije bilo 100% svo vreme nego je setalo izmedju 88% i 100% dok se RAID0 svojski znojio da isprati.

Po mom misljenju potpuno je nebulozno celo takmicenje.

Prvo, iskljucili su iz ucesca sve programerske mozgove iz Indije, Kine i Rusije, koji bi najpre mogli da urade nesto konkretno na tu temu.

Drugo, sta nama korisnicima/vlasnicima NVIDIA kartica znaci ubrzan mp3 enkoder pa jos samo za Linux?

Trece, zasto ne naprave DivX/h264/x264 enkoder preko GPU? Danas dobra 1920x1080p video kamera kosta ~790e, a enkodiranje te rezolucije jos ne moze cestito ni u realnom vremenu da se radi cak ni na Quad Core procesorima.

Sto se tice folding@home, zanima me samo jedna stvar -- da li ce raditi na 8800GTX (G80)?

Ako ne bude radio bice sasvim izvesno da je njihov klijent samo deo PR kampanje za novu karticu koja treba da izadje, a ne zelja da se pomogne covecanstvu. Smatram da ako su to iskreno hteli, mogli su i trebali to mnogo ranije da urade.

illidan · 23.05.2008

sorry za offt 🙂

audiofreak · 23.05.2008

illidan je napisao(la):
sorry za offt 🙂

Nije offt ako nam procitas koji je NV GPU u pitanju.

Nvidia tvrdi - CPU je mrtav

Čuven

Banned

Čuven

Čuven

Banned

Čuven

Jež

Čuven

Slavan

Banned

Jež

Čuven

Banned

Slavan

Slavan

Čuven

Banned

Slavan

Banned

Čuven

Slavan

Yoti

Guest

Slavan

Čuven

Čuven

Čuven

Slavan

Banned

- Bike Camper -

Banned