Šta je novo?

Nvidia tvrdi - CPU je mrtav

gtx280fohofx57wu7.jpg


kako kazu GTX 280
 

E da, jos kad bi Photoshop bio compute bound, a ne memory i storage bound aplikacija pa i da se radujemo.

U svakom slucaju, 3D funkcionalnost i brza manipulacija je dobrodosla ali ne treba ocekivati cuda.

We saw the presenter playing with a 2 GB, 442 megapixel image like it was a 5 megapixel image on an 8-core Skulltrail system.

E sad da se genuine javi i da nam kaze zasto nije Core 2 E2180 u toj masini bio kad nam vise ne treba CPU? :d

A mogao bi i da kaze sta misli koliko RAM-a i kakve diskove je imao taj sistem. 😉

P.S. Good luck editing this -- Cars HDR (1.4 GB ZIP, 268 MPix, 16-bit TIFF).
 
E sta mislis ko je bio na toj prezentaciji 🙂
Pa nije bio jer su hteli da pokazu kako najboljsi intelov procesor ne moze da se izbori ich sa takvim manipulacijama.
 
Poslednja izmena:
Najveci problem sa obradom tako velike slike je sporost memorijskog i disk podsistema.

Cisto da podsetim ljude, cak i Amiga 500 kada bi imala dovoljno chip memorije bi mogla da skroluje brzo po takvoj slici, a hardverski zoom i rotacija postoje od kad i video overlay, dakle nikako nisu u pitanju karakteristike i/ili mogucnosti iskljucivo najmodernijih GPU-ova.

E bas bezveze, a ja sam se bas ponadao da ce CS4 moci da radi bez procesora kad ono jos uvek nista od toga :d
 
jednostavno audio nisi bio u pravu. Sto se intela tice oni su zivi samo zahvaljujuci budjavom x86. To je nagori sljam koji postoji. 10000 instrukcija koje su samo nabacavane preko godina. Eto cmov kao primer, cemu to sluzi. Valjda dok se intel tripovao da bude risk.
intelov "prost format" sa zilijadru prefiksa. Niko i da oce ne moze da napravi brzi x86 procesor od intela bas zbog tog zakomplikovanja instrukcijskog seta. Oni u opste nemaju plan, samo kako izadje novi procesor jao vidi sto smo izmislili novu extra super fensi instrukciju, ista je ko stara samo joj dodas prefix 66 i onda radi u duploj preciznosti. Da amd nije malo sredio sa amd64 setvarno bi ostali na 4 registra.
 
Po 100-ti put :d-ti izvadi svoj 7600Go na sto i kucaj nam 100 x brze :type: 😛 :wall:
:wave:
 
jednostavno audio nisi bio u pravu.

U cemu nisam bio u pravu?

Eto cmov kao primer, cemu to sluzi.

CMOV = Conditional MOVe sluzi da izbegnes uslovne (i bezuslovne) skokove i iole dobri kompajleri ga koriste. Evo specijalno za tebe i primer:

Kod:
// C kod
	if (a == 5) {
		b = 3;
	} else {
		b = 1;
	}
	...

// ASM bez CMOV
	cmp	eax, 5
	jne	b1
	mov	ebx, 3
	jmp	b3
b1:
	mov	ebx, 1
b3:
	...

// ASM sa CMOV
	mov	ecx, 3
	mov	ebx, 1
	cmp	eax, 5
	cmoveq	ebx, ecx
	...

Mozda ovako ne izgleda kao bitna razlika, ali ako se ovakav kod nalazi u petlji mnogo je efikasnije ako nema grananja.

Oni u opste nemaju plan

Da li si svestan koliko to sto si rekao zvuci glupo?

Intel je dve godine pre izlaska procesora (Sandy Bridge) najavio AVX ekstenzije i izmene ASM sintakse u nedestruktivnu sintaksu sa tri operanda, a uskoro ce izaci i emulator da bi developeri mogli to da testiraju i pripreme svoje aplikacije unapred da iskoriste to znacajno unapredjenje arhitekture.

Da nemaju plan kako bi to mogli da najave toliko unapred? Stvarno pricas budalastine.

Da amd nije malo sredio sa amd64 setvarno bi ostali na 4 registra.

AMD ne da nije sredio nego nema blage veze.

Na primer, mogli su uz minimalne izmene da omoguce upotrebu ekstra registara i u 32-bitnom modu pa nisu. To pokazuje ili koliko ogranicenu mastu imaju ili koliko je 64-bitni marketing zapravo bio jedina stvar kojom su se rukovodili u dizajnu.

Da ne pominjem da su i oni dodali prefikse koje ti toliko ne volis kao da si nekad morao rucno da ih kodiras iz glave.

Sve u svemu, argumenti su ti blago receno smesni. Moraces ubuduce malo vise da se potrudis i pre svega da pokazes znanje, a ne da me pitas cemu sluzi CMOV instrukcija koja uzgred postoji od Pentiuma Pro.
 
pa ja izdebagova brdo programa generisanih vc++ kompajlerom i ne nadjo je. znam cemu sluzi, arm je to generalizovao na skoro sve aritmeticke instrukcije tako da mogu da imaju conditional , imaju ortogonalni set instrukcija dobro do duse kod arm-a su r13-14-15 rezervisani za sp,lr i pc.
Eto primer arm-a i strava ideje, imas registar koji ti sadrzi povratnu adresu kad skocis u proceduru lr, tako da nema igranja sa stekom osim ako ima ugnjezdjavanja sto moze a ne mora da bude slucaj. Arm recimo ima barel shifter na mislim svakoj instrukciji tako da kad sabiras dva registra jedan operand mozes da shiftujes za dzabe. Mislim ARM generalno mi se mnogo vise svidja od x86. Napisao sam zbrda zdola, barel shifter je u hardveru i daje besplatno shiftovanje. Mislim da ima cak i insturkcija madd tipa pomnozi dva broja i dodaj treci i to dodavanje je valjda isto za dzabe. To je plan 🙂

Muka mi je kad pogledam si , di , counter i akumulator i ostale ne znam kako da ih nazovem. R0-R15, ili R0-R31 to je nesto sto je lepo. nemam pojma , meni se jednostavno x86 ne svidja.. dobro je sto kao operand mozes da stavis memorijsku lokaciju jer to smanjuje pritisak na registre, lose mi je sve ostalo. kad krenem nesto da kucam prvo se zapitam, u kom mi je bese modu procesor, axa nije amd64 onda imam samo 8xmm registara, bemu.. nekako da su pametni pa da lepo redizajniraju set instrukcija. eto plan je intelu bio da nema ortogonalni set tj. cx je kaunter i nista vise , bp bazni pointer i sl... a onda kad su videli da to ne valja ajde da generalizujemo pa da svi mogu za sve da se koriste al neka su imena, znaci eto taj prelaz sa 286 na 386 koji je bio kljucan je mogo sve da sredi...
zasto recimo za sse nesu mogli odmah da predvide sta ce sve biti potrebno, kad i onako se ceka po sto godina na novi procesor pa da lepo upakuju sve a ne da cekam dot produkt u 4.1 verziji pa da se pitam jel ima jos neko taj procesor. ne znam. ja jako cenim intel jer su im procesori stvarno dobri i stabilni i rade ono sto im kazes al mi se ne svidja nacin na koji im kazes sta da rade
 
Poslednja izmena:
pa ja izdebagova brdo programa generisanih vc++ kompajlerom i ne nadjo je.

Pa ako nisi pre toga kompajlirao taj kod sa /G6 switch-em onda dzaba trazis. 😉

Eto primer arm-a i strava ideje, imas registar koji ti sadrzi povratnu adresu...

To je postojalo i pre ARM-a na nekim procesorima koliko se secam. Koliko god bila dobra ideja nije savrsena upravo zbog rekurzije.

Arm recimo ima barel shifter na mislim svakoj instrukciji tako da kad sabiras dva registra jedan operand mozes da shiftujes za dzabe.

LEA moze da uradi to isto na x86. Na primer LEA EAX, [EAX + EDX * 2].

Mislim ARM generalno mi se mnogo vise svidja od x86.

A meni se vise svidja MC 68000 sintaksa od ARM-a.

Mislim da ima cak i insturkcija madd tipa pomnozi dva broja i dodaj treci i to dodavanje je valjda isto za dzabe. To je plan 🙂

Dodavanje nije za dzabe tj. to nije poenta. Crni genuine, opet moram da te poducavam 😀

MADD/FMA/MAC je fused (spojena) operacija da bi se zadrzala veca preciznost pri akumulaciji rezultata.

Normalno procesor uradi mnozenje, zaokruzi rezultat prema trenutno aktivnom modu zaokruzivanja, zatim sabere pa opet zaokruzi rezultat. To dovodi do akumulacije greske. MADD ima samo jedno zaokruzivanje na kraju, a interno cuva medjurezultat izmedju dve operacije u beskonacnoj preciznosti.

Sto se tice plana, AVX donosi FMA na x86. I ne samo multiply-add nego i multiply-sub i negative multiply-add/sub, pa cak i multiply-add-sub. Takodje donosi i AES engine i vecu ortogonalnost instrukcijskog seta, kao i vec pomenutu nedestruktivnu sintaksu sa tri operanda (destination i dva source-a) 😛

kad krenem nesto da kucam prvo se zapitam, u kom mi je bese modu procesor, axa nije amd64 onda imam samo 8xmm registara, bemu..

Pa za taj propust se zahvali AMD-u, ne Intelu. Intel je samo "kopirao" AMD64 :d

eto plan je intelu bio da nema ortogonalni set tj. cx je kaunter i nista vise , bp bazni pointer i sl... a onda kad su videli da to ne valja ajde da generalizujemo pa da svi mogu za sve da se koriste al neka su imena, znaci eto taj prelaz sa 286 na 386 koji je bio kljucan je mogo sve da sredi...

A kako bi ti resio pristup AH i AL polovinama registra AX kad bi se on zvao R1?

Da ti nije mozda bolje sto pod AMD64 moras da pises R15D kad ti treba samo donja 32 bita registra R15 umesto da pises E15 kao sto i pises EAX umesto RAX?

Uostalom, zasto u AMD64 nema ortogonalnosti instrukcijskog seta?

AMD-u se pruzila jedinstvena prilika da isplanira i sprovede u delo bolje od Intela i eto sta uradise, a za nakaznost x86 naravno svi opet krive samo Intel.

zasto recimo za sse nesu mogli odmah da predvide sta ce sve biti potrebno, kad i onako se ceka po sto godina na novi procesor pa da lepo upakuju sve a ne da cekam dot produkt u 4.1 verziji pa da se pitam jel ima jos neko taj procesor.

Eh sad... to sto pitas je bas naiva na nivou francuske sobarice.

Zapitaj se kako bi prodali nesto novo ako bi svaki proizvod iz prve bio savrsen. Tako nesto ne postoji niti ce ikada postojati, pogotovo ne u necem sto se zove potrosacko drustvo.

Isto tako bih ja tebe mogao da pitam zasto GPU nije od starta bio programabilan.

Sto se tice dot produkta, nista te (osim eventualno lenjosti) ne sprecava da podrzis i starije procesore sa odgovarajucom zamenom za tu instrukciju. Naravno, bice sporije ali ce raditi. Kome bude trebalo brze kupice novi procesor isto kao sto je svojevremeno kupovao i novu DX9 graficku kartu iako je vec imao "DX9" GeForce FX.

ne znam. ja jako cenim intel jer su im procesori stvarno dobri i stabilni i rade ono sto im kazes al mi se ne svidja nacin na koji im kazes sta da rade

E pa genuine, niko te brate ne tera da programiras u asembleru ako ne volis. Ni meni se ne svidja nacin na koji se programira GPU pa se ne zalim okolo.
 
za audija:
LEA moze da uradi to isto na x86. Na primer LEA EAX, [EAX + EDX * 2].
to nije ono sto sam mislio
mislio sam na nesto tipa
add R1 , R1, R2 shl 3 pri cemu se vrednost r2 siftuje za tri ulevo..

za taj swich stvarno nisam znao, hvala na informaciji.. nagrada je slicica koja je u
atachmentu - slikano nokijom danas po tmurnom pacifickom vremenu..🙂

motorolin set svi hvale ali ga nisam pogledao tako da nemam ICH ( nije intelov chipset nego nasa domaca rec) predstavu o njemu.
gpu ne programiras setom instrukcija gpu-a jer je on nevidljiv za obicne smrtnike nego majkrosoftovim "setom instrukcija", koji i nije toliko strasan. U svakom slucaju nema redundanse kao kod intela..

spojene instrukcije intel trenutno nema jer nema troadresni format ako ne gresim, ali ima planove sto je dobro... bas cu da pogledam AVX sta donosi, mozda i oni urade nesto pametno.

audio, mora da se slozimo da intelov set instrukcija nije moderan koliko je moderan sam procesor. mislim da stvarno oko toga nema dileme. AMD64 je nesto sto je stvarno boljitak u odnosu na pre , steta sto nije samo rascistio sa svim zaostavstinama.
 

Prilozi

  • intel_hq.jpg
    intel_hq.jpg
    24.9 KB · Pregleda: 103
Poslednja izmena od urednika:
to nije ono sto sam mislio, mislio sam na nesto tipa
add R1 , R1, R2 shl 3 pri cemu se vrednost r2 siftuje za tri ulevo..

Pa shift u levo za tri je isto sto i mnozenje sa 8. Znaci samo napisi LEA EAX, [EAX + EDX * 8].

za taj swich stvarno nisam znao, hvala na informaciji..

Kazem ja lepo da je ljudima najlakse da kritikuju i da se plase onoga sto ne razumeju.

gpu ne programiras setom instrukcija gpu-a jer je on nevidljiv za obicne smrtnike nego majkrosoftovim "setom instrukcija", koji i nije toliko strasan. U svakom slucaju nema redundanse kao kod intela..

Pa meni se to ne svidja, mrzim apstrakciju i mrzim da zavisim od "dobrote" kompajlera, da ne pominjem eventualne regresije.

spojene instrukcije intel trenutno nema jer nema troadresni format ako ne gresim

Ne gresis. Trenutno nema.

ali ima planove sto je dobro... bas cu da pogledam AVX sta donosi, mozda i oni urade nesto pametno.

AVX je masivna promena i ja licno smatram da je na bolje. Bice steta ako AMD ne isprati to nego nastavi da vuce na svoju stranu sa SSE5. Obavezno pogledaj.

audio, mora da se slozimo da intelov set instrukcija nije moderan koliko je moderan sam procesor.

Pa ne moze ni da bude. Ono sto je jednom uslo nikad ne izlazi. Video si kako je AMD prosao sto je pokusao da izbaci LAHF instrukciju iz AMD64.

AMD64 je nesto sto je stvarno boljitak u odnosu na pre , steta sto nije samo rascistio sa svim zaostavstinama.

Oko toga cemo morati da se slozimo da se ne slazemo. 😉

Ja smatram da je AMD64 medvedja usluga i da povecanje broja registara i njihovo prosirenje nije donelo tako drastican boljitak u performansama. Pritom ne sporim da boljitak postoji ali smatram da je on vise posledica porasta svesti o potrebi optimizacije i razvoja arhitekture samih procesora.
 
Poslednja izmena:
ok LEA EAX, [EAX + EDX * 8], sad mi je jasno samo jedan problem
load effective address je samo mov, nije add, sub , mul i ostalo generalizovano... ali nije ni bitno
ja navijam da intel izbaci nesto ljudski isto, hocu da kazem da nemam nista protiv njih ali samo neka uloze u ISA koliko i u ostale stvari i bice ok

p.s.
zar nije lepse

mov R0,R1,R2 shl 3
mul R0,R1,R2 shl 3

nemam pojma, izgleda je stvar ukusa
 
Poslednja izmena:
e sad sam video nebulozu sa prvim mov R0,R1,R2 shl 3,
R1 je visak.. puna mi je vise glava sse-a pa se gubim polako...
 
Poslednja izmena:
ok LEA EAX, [EAX + EDX * 8], sad mi je jasno samo jedan problem load effective address je samo mov, nije add, sub , mul i ostalo generalizovano

Ne znam da li ti je bas skroz jasno. Ta instrukcija ima vise oblika:

Kod:
; load effective address (osnovna namena)
		lea	eax, adresa		; ovo je isto
		mov	eax, offset adresa	; sto i ovo
; jednonstavno mnozenje
		lea	eax, [eax + eax]	; mnozenje eax sa 2
		lea	eax, [eax + eax * 2]	; mnozenje eax sa 3
		lea	eax, [eax + eax * 4]	; mnozenje eax sa 5
		lea	eax, [eax + eax * 8]	; mnozenje eax sa 9
; sabiranje
		lea	eax, [eax + edx]	; sabiranje eax sa edx
; oduzimanje (edx mora biti negativan)
		lea	eax, [eax + edx]	; oduzimanje edx od eax
; sve gorepomenuto +/- konstanta
		lea	eax, [eax + edx * 8 - 100]

A sto se tice ovoga:

zar nije lepse

mov R0,R1,R2 shl 3
mul R0,R1,R2 shl 3

Meni je na primer bezveze da kucam shl 3 za nekoliko instrukcija. Ako mi vec treba vrednost pomnozena sa 8 u nekoliko uzastopnih operacija izracunacu je unapred. Em je efikasnije, em je citljivije, em je krace za kucanje. 😉
 
Poslednja izmena:
ma da ali je besplatno posto ide kroz barel valjda u svakom slucaju... nije ni bitno... u svakom slucaju je zaostavstina x86 iz doba 8086 samo sa 32bitnim registrima... stvar je recimo neko da te pita a sta je to eax, ecx, edx ti bi reko pa registri, akumulator , brojac i data ali je stvar sto vise nisu to nego su u stvari R0,R1,R3 i ako se zovu po starom posto svaki moze da se upotrebi za bilo sta... to je glupo jer je intel bar trebao da promeni imenovanje tih registara posto ocigledno nema veze koji za sta koristis.. to recimo meni smeta
 
Poslednja izmena:
recimo neko da te pita a sta je to eax, ecx, edx ti bi reko...

Pa ne bih. Rekao bih da su to registri opste namene, s tim sto neki od njih imaju odredjene "privilegije".

Na primer CL (deo ECX) se i dalje jedini moze koristiti za shift parametar (na primer SHR EAX, CL), a ECX jedini za LOOP i REP SCAS/LODS/STOS/MOVS za koje se takodje ekskluzivno koriste AL, ESI i EDI. Ima jos primera da ne dubim sad. To se ne moze ukinuti jer postoji gomila koda koji to koristi a i dan danas se koriste stari pentium procesori pa cak i 386/486 u nekim industrijskim resenjima.
 
pa eto, to je bas budj... i to se vuce i dan danas... joj sta bi dao za normalan set instrukcija sa intelovom tehnologijom
 
AMD-u se pruzila jedinstvena prilika da isplanira i sprovede u delo bolje od Intela i eto sta uradise, a za nakaznost x86 naravno svi opet krive samo Intel.

stvarno mislis da je x86 nakazan??

btw sto se tice barel shiftera - zar on nije bio izbacen iz hardwarea u NetBurstu??

pa eto, to je bas budj... i to se vuce i dan danas... joj sta bi dao za normalan set instrukcija sa intelovom tehnologijom

***, IBM je izabrao go*vno pre 30 godina; sta da se radi... :/
 
Poslednja izmena:
Pa nista, mora da predjemo na arm polako.. to nam je sudbina... 🙂
 
update na temu Adobe & GPGPU:

http://www.tgdaily.com/content/view/37643/128/

besmisleno je ulaziti u shpekulacije zasto se Adobe sada povlaci i umanjuje citavu pricu, jer bi to samo podgrejalo flameboyovanje... ono sto je pak cinjenica koja ne moze a da se ne pomene u kontekstu ove teme jeste da je ovaj Adobeov potez pravi "pljuc" u lice NVIDIA-i nakon Editors Day-a na kome je ova demonstracija snage GPGPU-a bila key point... no Adobe je to, moze im se!
 
update na temu Adobe & GPGPU:

http://www.tgdaily.com/content/view/37643/128/

besmisleno je ulaziti u shpekulacije zasto se Adobe sada povlaci i umanjuje citavu pricu, jer bi to samo podgrejalo flameboyovanje... ono sto je pak cinjenica koja ne moze a da se ne pomene u kontekstu ove teme jeste da je ovaj Adobeov potez pravi "pljuc" u lice NVIDIA-i nakon Editors Day-a na kome je ova demonstracija snage GPGPU-a bila key point... no Adobe je to, moze im se!

Svakako treba procitati blog post koji je napisao John Nack. Covek je rekao da on nije na prezentaciji nazvao sledecu verziju CS4 niti je cuo druge iz Adobea da ga tako zovu. Takodje je rekao da su u pitanju samo tech demonstracije (tipa da se vidi "sta se kuva" u Adobe kuhinji) i da se jos ne zna da li ce i u koju verziju proizvoda ta funkcionalnost biti ubacena, pa ni kada ce taj proizvod izaci.

Ja smatram da je NVIDIA krajnje frivolno i neodgovorno zloupotrebila tu prezentaciju za licnu promociju stvarajuci odredjena iscekivanja kod ljudi koji su procitali "vest" koju je TGDaily tako tendenciozno i bez provere objavio.
 
ma bre gluposti. po X-ti put na Mac-u imas vec nekoliko programa a la PhotoShop koji koriste GPU ...

pa i sam Apple je napravio demonstraciju za Core Image pre dve godine i otvorio sam temu ovde ali ocigledno da je to retko koga zainteresovalo... ali nema veze, evo sad je i to doslo na red 🙂 - upotreba GPU u grafickim programima! (kao sto sam rekao PC korisnici retko kad pogledaju preko plota - da ne kazem bas da su kratkovidi 😀 jer cu opet popiti warn)

http://benchmark.co.yu/forum/showthread.php?t=132104

btw na sta se odnosi opcija "Enable 3D acceleration" u PhotoShopu CS3 ???
 
Poslednja izmena:
Poslednja izmena:
Nazad
Vrh Dno