Šta je novo?

Nvidia tvrdi - CPU je mrtav

Strategija za CPU: Kako naterati par threadova da rade brzo?
Taktika je smanjivanje latencije. Veliki cache da bi bila veca verovatnoca "pogotka", instrukcijski i data prefetch i spekulativno (OoO) izvrsavanje. Limit je bandwidth. Siroka oblast primene, relativno mala racnska moc.
OoO jezgro=kompleksnost=dimenzije=mali broj jezgara...
 
Sto se tice dfinicije sta je thread ne bih se skroz slozio sa tobom. Mislim da je thread u GPU malo drugaciji.. U principu, vise procesora dele isti program i isti IP ali taj program ima razlicite ulazne parametre. Sa jedne strane, svi dele isti IP a sa druge rade sa razlicitim podacima. Medjutim, rezultat rada svih tih procesora je razlicit, tj posao koji obavljaju je vesestruko paralelizovan.

Znaci i jeste thread i nije thread.

Da, otvoreno je za tumacenje i bas sam iz tog razloga posebno naveo sta podrazumevam pod thread-om.
Koliko sam video, nVidia uvodi sledece pojmove za CUDA: grid, block i thread.
-Problem se prvo deli u sekvencijalne delove - grids. Oni ne mogu paralelno da se izvrsavaju.
-Grid se deli na nezavisne paralelne block-ove koji mogu paralelno da se izvrsavaju i svaki block cini nezavisan program (dakle svakom je potreban po jedan IP).
-Block se deli na paralelne elemente. Izvrsavalje razlicitih podataka koji prate isti IP - nVidia ovo naziva thread-om.

E sad, stvar je u tome sto izvrsavanje istih instrukcija nad razlicitim podacima u stvari predstavlja SIMD (Single Instructon Multiple Data) - npr. nad 8 razlicitih podatak se izvrsava ista instrukcija. NVidia svaki podatak racuna kao thread.
S druge strane, MIMD (Multiple Instruction Multiple Data) izvrsavanje koje dozvoljava nezavisne poslove je ono sto se tradicionalno podrazumevam pod "thread-om". NVidia ovo naziva block.

Ovo bi se moglo posmatrati kao kada bi x86 instrukcija [bold]mov reg, mem[/bold] moga da izazove promenu threada dok ne stigne rezultat iz memorije.

Bas je to radio P4 sa hyperthreading. Jedan thread radi dok drugi ceka.
Pored toga, out-of-order izvrsavanje ovo regulise i unutar jednog thread-a.

Dok ce Larrabee jezgra biti in-order, ona bi mogla imati load-lookahead koji je relativno lako realizovati i bez potpunog OoO jezgra. In-order procesor sa load-lookahead odrzava redosled svih instrukcija sem load-ova, koji mogu vanredno da se izvrsavaju. Load se izvrsava sto pre kako bi amortizovao memory latency.

Strategija za CPU: Kako naterati par threadova da rade brzo?
Taktika je smanjivanje latencije. Veliki cache da bi bila veca verovatnoca "pogotka", instrukcijski i data prefetch i spekulativno (OoO) izvrsavanje. Limit je bandwidth. Siroka oblast primene, relativno mala racnska moc.

Rekao bih da je ovo strategija za klasicna fat CPU jezgra, dok nova mini jezgra koja cine Larrabee mnogo blize prate ovu strategiju koju si predlozio za GPU. A postoje i mini jezgra tipa Atom, koja imaju treci cilj.

Kako li ce Intel sa Larrabee-em da pomiri ova dva sveta?

Larrabee definitivno ne moze da ih pomiri. To bi eventualno mogao procesor sa heterogenim jezgrima (2 ili vise razlicitih tipova jezgara). Mada ni takav procesor ne moze da zadovolji sve segmente podjednako.
 
😀
THE WAR OF WORDS that broke out between Nvidia and Intel has AMD chuckling along from the sidelines.

“One says the CPU is not important, the other says the GPU is not important. The beauty of AMD is that we provide a balance with a strong CPU and a strong GPU - the company best tailored to provided a balanced PC,” puffed Giuseppe Amato, AMD’s technical director of sales and marketing in EMEA. “We hope we see some gain from the fight these two are having together.”
LINK
 
Poslednja izmena:
rofl :d

ruku na srce, istina je to sto govore, ali nije tesko biti u top 10 kad imas skupa dva igraca...Samo, u ekstremnoj situaciji gde bi recimo svi koristili Larrabee AMD bi skroz puko jer nam GPU od njih ne treba, ni CPU takodje. Ako nvidia izbaci CPU (dakle rekoh, u nekoj ekstremnoj i fiktivnoj situaciji) iz igre, AMD opet propada. Bolje da cute 😀
 
rofl :d

ruku na srce, istina je to sto govore, ali nije tesko biti u top 10 kad imas skupa dva igraca...Samo, u ekstremnoj situaciji gde bi recimo svi koristili Larrabee AMD bi skroz puko jer nam GPU od njih ne treba, ni CPU takodje. Ako nvidia izbaci CPU (dakle rekoh, u nekoj ekstremnoj i fiktivnoj situaciji) iz igre, AMD opet propada. Bolje da cute 😀
i onda je mrmot zamotao cokoladicu... pfff
 
Ufff brate, zamotaste ga sa tehnikalijama... Trebalo mi je 45 minuta da bih lepo procitao postove, clanke, konsultuvao Wikipediu... A trebace mi jos barem triput toliko da bih sve lepo skontao...
Moze li samo malkice jednostavnije za nas sa jeftinijim ulaznicama... 🙂
 
Ufff brate, zamotaste ga sa tehnikalijama... Trebalo mi je 45 minuta da bih lepo procitao postove, clanke, konsultuvao Wikipediu... A trebace mi jos barem triput toliko da bih sve lepo skontao...
Moze li samo malkice jednostavnije za nas sa jeftinijim ulaznicama... 🙂

Ja sam se trudio, ali sam digo ruke.🙂
 
Evo najbolji primer, imas 500 evra i hoces da se igras, da gledas filmove, da teras vistu, obradu slika sl Sta bi stavio u taj racunar od 500 evra od komponenata.... Pitanje vazi za sve sa foruma , moze i novi tread da se napravi. Bez monitora naravno...

p.s.
namena je gore navedena, ako neko kaze a baze podataka, raytracing, arhiviranje i sl.. ispada iz igre
 
Poslednja izmena:
Evo najbolji primer, imas 500 evra i hoces da se igras, da gledas filmove, da teras vistu, obradu slika sl Sta bi stavio u taj racunar od 500 evra od komponenata.... Pitanje vazi za sve sa foruma , moze i novi tread da se napravi. Bez monitora naravno...

p.s.
namena je gore navedena, ako neko kaze a baze podataka, raytracing, arhiviranje i sl.. ispada iz igre

look'n'stop + seba mods x2 leexher
 
X2 4000+
TF770
9600GT
2x1Gb rama
160Gb HDD
Case
DVDRW
 
pa to mu treba, ostalo je manje-vise nebitno 🙂 dobar firewall da mu racunar radi dok je na netu, dok je na netu i skida igre i filmove koje oce da igra/gleda stavi seba14 2x leecher klijent da moze da odrzava ratio ko covek sa ovim nasim ubogim netom. Ostatak je hardwer koji sam po sebi nista ne znaci 🙂 Eto, coola je naveo konfu koja je sasvim ok. Cak necu ni intel da potenciram iako bi mogao da udje u tu sumu.
 
Larabi puca na dynamic branchingu u sejderima ako koristi 512bitne registre.. sta ako jedan verteks oce na jednu stranu a drugi na drugu, hm... da podelim registre pa nek putuju
 
genuine jesi li se prijavio: http://cudacontest.nvidia.com/index.cfm?action=contest.contest&contestid=2

😉

ovo je prilicno dobar zadatak, obzirom da je LAME jos na verziji 3.97alpha odustao od MT optimizacije jer se pokazalo da negativno utice na kvalitet zvuka... pa su se okrenuli eksploataciji performansi koje su donele nove verzije Intelovih kompajlera.

Prakticno MP3 kompresija danas je single threadovana 100% i bilo bi lepo videti da neko nadje CUDA resenje koje ce doneti ubrzanje, a nece negativno uticati na kvalitet na izlazu...
 
jel ce GPU ubacivat 3D surround automacki prilikom reencodinga?
 
genuine jesi li se prijavio
onda bi bila namestaljka da neko iz firme dobije nagradu 😀
uvek me interesovalo zasto ne apdejtuju dalje LAME...

posto ne ispunjava uslove moze da pokusa za svoju dusu 😉
* Age 18 or older
* Resident in the United States or Canada
* Not a corporate or institutional entity
* Not an employee of NVIDIA, its affiliates, or members of their immediate families and/or households
 
Poslednja izmena:
Larabi puca na dynamic branchingu u sejderima ako koristi 512bitne registre.. sta ako jedan verteks oce na jednu stranu a drugi na drugu, hm... da podelim registre pa nek putuju

To je problem kod GPU-a jer nema odgovarajuce instrukcije. Na x86 mogu da se vektorizuju i uslovi/poredjenja.

Takmicenje im je zakon, testiraju na Core 2 Duo E2180 pod Linux-om. :d
 
Poslednja izmena:
Арогантно је с њихове стране што мора да будеш из Америке да би могао да учествујеш. Ја баш скупио пар другара кад оно...
Но добро, какав конкурс, такво ће бити и решење.
 
Poenta testiranja na "slabom" cpu je da se pokaze da ti ne treba brz jer ce sve gpu da radi.
 
Sve sto koristi 80% tvog vremena za kompom kada ti cpu nije idle 🙂
 
ova vest me je podsetila na moju raspravu sa Audiom u vezi malih i velikih koraka na polju GPGPU-a:

http://www.pcper.com/comments.php?nid=5679

@genuine
jel se ovi momci zezaju ili ti stvarno radis za 'vidiju?
 
Poslednja izmena:
Ја знам да све више наших ради тамо, а и неки моји другари треба да иду овог лета на три месеца.
 
Ја знам да све више наших ради тамо, а и неки моји другари треба да иду овог лета на три месеца.
to je fantasticna stvar!
ako mozes, molio bih te da mi bacis par detalja na PM!
 
pa trenutno "radim" kao intern na 6 meseci probno, za dalje ne znam nista..
 
Poenta testiranja na "slabom" cpu je da se pokaze da ti ne treba brz jer ce sve gpu da radi.

Pre svega uopste nema poente ubrzavati mp3 enkodiranje:

Kod:
M:\Music\1-CD\Misija>gogo -b 256 -m s -q 0 "Unknown Artist - Unknown Title.wav"
encode Unknown Artist - Unknown Title.wav to Unknown Artist - Unknown Title.mp3
GOGO-no-coda ver. 3.11 (Jan 10 2003) is a mp3 encoder based on lame 3.88,
which is distributed under LGPL on http://www.mp3dev.org/mp3/ .
See http://member.nifty.ne.jp/~pen/ ,
    http://homepage1.nifty.com/herumi/gogo_e.html .
family 6:vendor Intel
extended instruction - MMX EMMX CMOV SSE SSE2 CLFLUSH
enabled extended instruction - MMX EMMX CMOV SSE SSE2 CLFLUSH
MPEG 1 layer III
{ 179477/ 179477} 100.0% (116.30x)  re:[00:00:00.00] to:[00:00:40.31]

116.30x je brzina u odnosu na realtime. Konkretno ovaj fajl od 788.7 MB (vreme trajanja 01h 18m 08s) je spakovan za svega 40 sekundi na E8200 (2.66GHz).

Da limitacija nije citanje sa diska verovatno bi to islo i brze jer zauzece procesora nije bilo 100% svo vreme nego je setalo izmedju 88% i 100% dok se RAID0 svojski znojio da isprati.

Po mom misljenju potpuno je nebulozno celo takmicenje.

Prvo, iskljucili su iz ucesca sve programerske mozgove iz Indije, Kine i Rusije, koji bi najpre mogli da urade nesto konkretno na tu temu.

Drugo, sta nama korisnicima/vlasnicima NVIDIA kartica znaci ubrzan mp3 enkoder pa jos samo za Linux?

Trece, zasto ne naprave DivX/h264/x264 enkoder preko GPU? Danas dobra 1920x1080p video kamera kosta ~790e, a enkodiranje te rezolucije jos ne moze cestito ni u realnom vremenu da se radi cak ni na Quad Core procesorima.

Sto se tice folding@home, zanima me samo jedna stvar -- da li ce raditi na 8800GTX (G80)?

Ako ne bude radio bice sasvim izvesno da je njihov klijent samo deo PR kampanje za novu karticu koja treba da izadje, a ne zelja da se pomogne covecanstvu. Smatram da ako su to iskreno hteli, mogli su i trebali to mnogo ranije da urade.
 
Poslednja izmena:
folding4.jpg


sorry za offt 🙂
 
Nazad
Vrh Dno