Šta je novo?

NVIDIA Volta

Ovde je malo opsirnije objasnjeno o Volti. Interesantno zapazanje autora.

Istog sam misljenja da je Volta ipak dizajnirana za nizi nanometarski proces od 16nm ali je prilagodjena za 16nm na kraju.
Sa tog aspekta moze da se posmatra kao Paskal druge generacije ali sigurno da to nece biti jer se radi o razlicitom arhitektualnom resenju.
Volta ce pored HBM2 imati asinhrone sejdere na hardverskom nivou, bar se tako prica a i logicno je ovaj put.

Mogla bi da se ocekuje u maju sledece godine. Znaci GV104 stize kao 2080 ;)

http://wccftech.com/nvidia-roadmap-2017-volta-gpu/
 
Ma vec u decembru neka dodje, nije rano uopste...i sad ce izbaciti Voltu koja ima AS kako treba, a Pascal je fail po buducnost, cim izbacuju tako brzo novu seriju...
 
Stojim iza toga da su majstori za pravljenje novca.
Paskal je generalno tu da popuni prostor izmedju Maksvela i Volte. Taman da potraje citavih godinu dana dok Volta ne izadje ako su informacije tacne.

Paskal nece biti niti je fail, ako aludiras na DX12, nece to jos za koju godinu, malo ce igara dokaciti i Voltu tako da sa te strane nista novo.
Meni se vise cini da je ovde rec o potpunoj dominaciji nad trzistem jer ako oni Voltu izbacuju sledece godine, AMD prakticno nema sta da ponudi, bice u pat poziciji, nesto slicno kao
dok je 28nm bio aktuelan.
 
Jednostavno, Nvidia sada ima ceo high end za sebe. Ovim tempom, ako zaista izbaci Voltu na proleće naredne godine, imaće i ceo segment srednje klase za sebe. I to će onda biti to.
 
Stojim iza toga da su majstori za pravljenje novca.
Paskal je generalno tu da popuni prostor izmedju Maksvela i Volte. Taman da potraje citavih godinu dana dok Volta ne izadje ako su informacije tacne.

Paskal nece biti niti je fail, ako aludiras na DX12, nece to jos za koju godinu, malo ce igara dokaciti i Voltu tako da sa te strane nista novo.
Meni se vise cini da je ovde rec o potpunoj dominaciji nad trzistem jer ako oni Voltu izbacuju sledece godine, AMD prakticno nema sta da ponudi, bice u pat poziciji, nesto slicno kao
dok je 28nm bio aktuelan.

Svakako i AMD-u treba nova arhitektura, Vega ce izaci pritisnuti Pascal imace vecu potrosnju i sve mane koje prate AMD, Volta ce izaci kao i sada Pascal dominirace, ali to samo znaci da ce AMD morati poraditi sto je prije moguce na novoj arhitekturi.
 
Ovde su neki oduševljeni rastom akcija na berzi, ako su istu učetvorostručili (između ostalog) valjanjem jedne te iste arhitekture u prethodnim godinama, što bi odustajali od tog puta? :D
 
Pa izgleda da i nece odustajati. Verovatno se radi o tranziciji na nizi nm. 10 nm je planiran kada i Navi od AMD tj. 2018-te godine.

P.S. @goldi
Vega ce mozda pritisnuti GTX 1080 ali ce prazan prostor ostati za Titan X i GTX 1080 Ti.
 
Pa za sada ne znamo ništa ni o čemu. Sve su samo nagađanja. Što se AMD-a tiče, možda će Vega imati 2 varijante kao i polaris, tj. ekvivalente GP104 i GP102. A što se Volte tiče, ne znam o čemu raspravljati kad se tek tu ništa ne zna. Male su šanse da bude značajnih promena u arhitekturi, osim HBM-a. Ali već je GP100 pravljen za HBM, pa možda onda Volta bude samo GP100 za narod. A ako hoće da izbacuju high-end čipove sa HBM2 i da menjaju GP104 i GP102, onda mi se čini da je malo šta moguće unaprediti za relativno kratko vreme. Dizajn tih čipova bi već trebalo da bude gotov i da uskoro izađu prvi test primerci. Nema više velikih pomaka, tj. promena u arhitekturu, sa razlogom. Što ne znači da je ovo što imamo loše i da ti pomaci nisu bitni :D
 
Ne, AMD neće propasti, jer će u tom periodu imati Zen procesore, koji će im doneti određeni bust, ma kakvi da budu, jer će svakako biti bolji od onoga što trenutno imaju u ponudi. Ali bi moglo značiti tačku bez povratka u domenu grafike. Dalje strmoglavljivanje™ udela, i odbacivanje podrške od strane kreatora igara i dodatnih tehnologija kojima se jednostavno neće više isplatiti da podržavaju karte koje se više ne kupuju. AMD-u će ostati da proba sa nekim besplatnim inovacijama i tehnologijama koje će da deli okolo, nalik na ono što sada čini sa Freesync-om i Mantle-om, samo još mnogo dublje, u nadi da će ga neko podržati. Ali zbog toga što će to sve biti besplatno neće imati odakle da ih održava, podržava i razvija nove. I tako će vremenom tavoriti.

Naravno, to nije scenario koji priželjkujem, ali se bojim da više ništa ne zavisi od samog AMD-a, barem kada je reč o domenu grafike. U međuvremenu ćemo dobijati konfliktne izveštaje o kompanijinom tržišnom učinku, budući da kretanje akcija nema toliko veze sa tehnologijama, već percepcijama i istupima CEO-ova i najavama šta je sve u razvoju...Par pozitivnih članaka u Washington Postu ili New York Timesu je bitnije od nekih tamo Techpowerupova, Tomshardwarea i Anandtechova.
 
Poslednja izmena:
Pa za sada ne znamo ništa ni o čemu. Sve su samo nagađanja. Što se AMD-a tiče, možda će Vega imati 2 varijante kao i polaris, tj. ekvivalente GP104 i GP102. A što se Volte tiče, ne znam o čemu raspravljati kad se tek tu ništa ne zna. Male su šanse da bude značajnih promena u arhitekturi, osim HBM-a. Ali već je GP100 pravljen za HBM, pa možda onda Volta bude samo GP100 za narod. A ako hoće da izbacuju high-end čipove sa HBM2 i da menjaju GP104 i GP102, onda mi se čini da je malo šta moguće unaprediti za relativno kratko vreme. Dizajn tih čipova bi već trebalo da bude gotov i da uskoro izađu prvi test primerci. Nema više velikih pomaka, tj. promena u arhitekturu, sa razlogom. Što ne znači da je ovo što imamo loše i da ti pomaci nisu bitni :D

Volta je kompletno nova arhitektura. Pricas na pamet. Koje kratko vreme? Arhitektura se ne projektuje onda kada se nesto najavi. :D
Volta je planirana za 2018 najvise zbog 10nm ali sudeci po vestima ocigledno ju je moguce prilagoditi za 16nm.
Ni Maksvel niko nije ocekivao u 28nm pa su izbacili odlicne karte, Maksvel je isto planiran za nizi nanometarski proces.
 
Šta ti znači kompletno nova arhitektura? Hoćeš da kažeš da Pascal nije nov? Naravno da je baziran na prethodnoj, ali ima i dosta novina. Ja kada kažem značajne, mislim da neće biti izmišljanja tople vode, već ono na šta smo navikli - poboljšanje već postojećeg, pri čemu su neki delovi čipa više a neki manje unapređeni.

Niko ne pravi tako složen čip od nule, zato mi nije jasno šta se podrazumeva pod tim "kompletno". Možda je Zen takav primer, ali i nije baš najbolji jer se ni tu ne izmišlja topla voda, već uzima najbolje iz prethodnih generacija, malo se gleda konkurencija i radi se na tome da se ne ponove greške od ranije. To su ljudi sa ogromnim iskustvom, svakako znaju mnogo više od nas šta treba da se unapredi. U suštini jedino za šta znam da je kompletno nova arhitektura je ono što radi Soft Machines, tj. VISC. Ali od te tople vode za sada nema mnogo koristi.

Ako neko hoće da izbaci nov proizvod sledeće godine u ovo doba, onda su tehničke specifikacije tog proizvoda već gotove i prvi prototipovi već na internim testovima. Ne samo kada je GPU u pitanju već bilo koji iole složeniji proizvod namenjen serijskoj ili masovnoj proizvodnji. A procesori su postali veoma složeni i testiranje gotovog proizvoda traje bar 6 meseci. Pa se i pored toga javljaju greške koje je naknadno potrebno ispravljati (Skylake bug pod velikim opterećenjiem, ovi sitni bugovi koji su pratili Pascal i Polaris, greške na gomili SSD-ova i slično) kroz microcode, firmware, BIOS... Nemam iskustva u GPU proizvodnji, ali imam u nekoj drugoj i znam kako teku stvari u industriji.

Evo krenula je priča o velikom skoku Maxwella (Tile-based Rasterization in Nvidia GPUs ) i odakle zapravo to potiče. Naizgled sitnica, koristi se već, ništa revolucionarno što zahteva kompeltnu izmenu arhitekture, ali ima veliki značaj. Kao što su nove tehnike kompresije omogućile veći protok na manjoj magistrali. Ali to rade svi i tu se očekuju unapređenja u svakoj novoj generaciji. Pitanje je šta nVidia ostavila za Voltu. Što se tiče procesa, ja koliko sam pratio, TSMC je najavio 10nm za sledeću godinu (praktično za kraj ove), tako da ako su se spremali za niži proces, imaće ga. Ako ostaju na 16nm, da li to znači da je Volta projektovana za 16nm? U suštini prelazak na niži, tj. ostanak na istom zahteva samo vreme i novac, a promena arhitekture zahteva pre svega mozganje (+ vreme i novac). Zato mislim da ako izbacuju novi proizvod u relativno kratkom periodu, a taj period su morali da troše na izmene zbog procesa (ako je uopšte i bilo planirano da ide u 10nm), onda ne znam koliko je ostalo za arhitekturu. Pri čemu znamo da su morali da je prilagode za HBM. Ako su godinama razvijali novine i imali nešto veliko što nije stiglo u Pascal, onda se može očekivati veliki skok. Poenta je da su obe mogućnosti podjednako verovatne, i da niko nema pojma šta zapravo imaju na stolu. Šta god da bude biće očekivano
 
Poslednja izmena:
Koje su to novine na Pascal-a u odnosu na Maxwell?
 
Piše da su razlike jako male i da je glavna stvar nov proizvodni proces.
 
Anand radi ubedljivo najbolji review arhitekture, toliko detaljno, da ti ne treba nijedan drugi..

Pascal je ispeglani Maxwell na visokim taktovima, ima promena u arhitekturi ali nisu revolucionalne. Najveca snaga Pascal-a je upravo to sto ceo chip (cuda cores, ROP-ovi, TMU, cash...) radi na skoro 2 Ghz zbog cega nema slabih tacaka:

82897.png


82899.png


82900.png


Sto se tice async compute-a:

The issue, as it turns out, is that while Maxwell 2 supported a sufficient number of queues, how Maxwell 2 allocated work wasn’t very friendly for async concurrency. Under Maxwell 2 and earlier architectures, GPU resource allocation had to be decided ahead of execution. Maxwell 2 could vary how the SMs were partitioned between the graphics queue and the compute queues, but it couldn’t dynamically alter them on-the-fly. As a result, it was very easy on Maxwell 2 to hurt performance by partitioning poorly, leaving SM resources idle because they couldn’t be used by the other queues.
Getting back to Pascal then, Pascal finally fixes the resource allocation issue. For Pascal, NVIDIA has implemented a dynamic load balancing system to replace Maxwell 2’s static partitions. Now if the queues end up unbalanced and one of the queues runs out of work early, the driver and work schedulers can step in and fill up the remaining time with work from the other queues.
At the same time however I feel it’s important to note that the scheduling change alone won’t (and can’t) guarantee that Pascal will see significant gains from async compute across the board. Async compute itself is a catch-all term – there are lots of things you can do with asynchronous work submission/execution – so async doesn’t mean that a game is making significant use of concurrency. Furthermore the concurrency is still based on filling execution bubbles, and that means that there needs to be bubbles to fill in the first place. In other words, the greatest gains from async will come from scenarios where for whatever reason, the graphics queue and its synchronous shaders can’t completely saturate the GPU on its own.
Right now I think it’s going to prove significant that while NVIDIA introduced dynamic scheduling in Pascal, they also didn’t make the architecture significantly wider than Maxwell 2. As we discussed earlier in how Pascal has been optimized, it’s a slightly wider but mostly higher clocked successor to Maxwell 2. As a result there’s not too much additional parallelism needed to fill out GP104; relative to GM204, you only need 25% more threads, a relatively small jump for a generation. This means that while NVIDIA has made Pascal far more accommodating to asynchronous concurrent executeion, there’s still no guarantee that any specific game will find bubbles to fill. Thus far there’s little evidence to indicate that NVIDIA’s been struggling to fill out their GPUs with Maxwell 2, and with Pascal only being a bit wider, it may not behave much differently in that regard.

Meanwhile, because this is a question that I’m frequently asked, I will make a very high level comparison to AMD. Ever since the transition to unified shader architectures, AMD has always favored higher ALU counts; Fiji had more ALUs than GM200, mainstream Polaris 10 has nearly as many ALUs as high-end GP104, etc. All other things held equal, this means there are more chances for execution bubbles in AMD’s architectures, and consequently more opportunities to exploit concurrency via async compute. We’re still very early into the Pascal era – the first game supporting async on Pascal, Rise of the Tomb Raider, was just patched in last week – but on the whole I don’t expect NVIDIA to benefit from async by as much as we’ve seen AMD benefit. At least not with well-written code.

Ja ovo pricam odavno. Poenta async compute-a je da uposli idle jedinice. AMD arhitektura vec neko vreme ide na high-ALU count gde ima daleko veci broj neiskoriscenih jedinica (execution bubbles kako ih zovu na Anandu). Zato je i veci benefit od async-a.
Sve se uklapa u pricu - zato su i gurali Mantle - da bi omogucili svojoj arhitekturi da bude bolje iskoriscena.
 
Poslednja izmena:
Volta je kompletno nova arhitektura. Pricas na pamet. Koje kratko vreme? Arhitektura se ne projektuje onda kada se nesto najavi. :D
Volta je planirana za 2018 najvise zbog 10nm ali sudeci po vestima ocigledno ju je moguce prilagoditi za 16nm.
Ni Maksvel niko nije ocekivao u 28nm pa su izbacili odlicne karte, Maksvel je isto planiran za nizi nanometarski proces.

Napokon resili da napuste fermi tj., SM?!
 
Šta ti znači kompletno nova arhitektura? Hoćeš da kažeš da Pascal nije nov? Naravno da je baziran na prethodnoj, ali ima i dosta novina. Ja kada kažem značajne, mislim da neće biti izmišljanja tople vode, već ono na šta smo navikli - poboljšanje već postojećeg, pri čemu su neki delovi čipa više a neki manje unapređeni.

Niko ne pravi tako složen čip od nule, zato mi nije jasno šta se podrazumeva pod tim "kompletno". Možda je Zen takav primer, ali i nije baš najbolji jer se ni tu ne izmišlja topla voda, već uzima najbolje iz prethodnih generacija, malo se gleda konkurencija i radi se na tome da se ne ponove greške od ranije. To su ljudi sa ogromnim iskustvom, svakako znaju mnogo više od nas šta treba da se unapredi. U suštini jedino za šta znam da je kompletno nova arhitektura je ono što radi Soft Machines, tj. VISC. Ali od te tople vode za sada nema mnogo koristi.

Ako neko hoće da izbaci nov proizvod sledeće godine u ovo doba, onda su tehničke specifikacije tog proizvoda već gotove i prvi prototipovi već na internim testovima. Ne samo kada je GPU u pitanju već bilo koji iole složeniji proizvod namenjen serijskoj ili masovnoj proizvodnji. A procesori su postali veoma složeni i testiranje gotovog proizvoda traje bar 6 meseci. Pa se i pored toga javljaju greške koje je naknadno potrebno ispravljati (Skylake bug pod velikim opterećenjiem, ovi sitni bugovi koji su pratili Pascal i Polaris, greške na gomili SSD-ova i slično) kroz microcode, firmware, BIOS... Nemam iskustva u GPU proizvodnji, ali imam u nekoj drugoj i znam kako teku stvari u industriji.

Evo krenula je priča o velikom skoku Maxwella (Tile-based Rasterization in Nvidia GPUs ) i odakle zapravo to potiče. Naizgled sitnica, koristi se već, ništa revolucionarno što zahteva kompeltnu izmenu arhitekture, ali ima veliki značaj. Kao što su nove tehnike kompresije omogućile veći protok na manjoj magistrali. Ali to rade svi i tu se očekuju unapređenja u svakoj novoj generaciji. Pitanje je šta nVidia ostavila za Voltu. Što se tiče procesa, ja koliko sam pratio, TSMC je najavio 10nm za sledeću godinu (praktično za kraj ove), tako da ako su se spremali za niži proces, imaće ga. Ako ostaju na 16nm, da li to znači da je Volta projektovana za 16nm? U suštini prelazak na niži, tj. ostanak na istom zahteva samo vreme i novac, a promena arhitekture zahteva pre svega mozganje (+ vreme i novac). Zato mislim da ako izbacuju novi proizvod u relativno kratkom periodu, a taj period su morali da troše na izmene zbog procesa (ako je uopšte i bilo planirano da ide u 10nm), onda ne znam koliko je ostalo za arhitekturu. Pri čemu znamo da su morali da je prilagode za HBM. Ako su godinama razvijali novine i imali nešto veliko što nije stiglo u Pascal, onda se može očekivati veliki skok. Poenta je da su obe mogućnosti podjednako verovatne, i da niko nema pojma šta zapravo imaju na stolu. Šta god da bude biće očekivano

Paskal jeste nov svakako samim tim sto su vidna unapredjena, ali je vise nesto kao hibrid, negde izmedju "kompletno" nove arhitekture i prethodnog dizajna.
Kao unapredjeni Maksvel sa prednostima nizeg procesa proizvodnje. Tvikovana arhitektura. Zato kazem kompletno. Volta nece to biti.

Pricas istu pricu koju su DAS i DusanK meni govorili kada sam rekao da ce Envidija najverovatnije ici na GDDR5X i da nece koristiti HBM.

Koliko im je tu trebalo za promenu tj. redizajn? Zasto mislis da ako je jedna arhitektura projektovana za naredni nizi nm proces nije isprobana i u postojecem?
Sta se desilo sa Maksvelom koji je takodje prvobitno najvaljen za nizi nm proces a na kraju produciran u 28nm?

Koliko im je tu trebalo za promenu obzirom da se Maksvel veoma brzo i neocekivano predstavio kroz 28nm?
Prati samo analogiju i bice ti neke stvari jasne, ne moras sebe muciti dodatnim pitanjima i potpitanjima i od toga praviti misteriju.

Te novine i revolucionarni skok se odlazu vec neko vreme. Volta bi definitivno trebala da dobije nesto od toga i cenim da ce skok u performansama biti veci nego sto je Maksvel doneo u odnosu na Keplera.
Ne bih se iznenadio da dobijemo isti napredak kao sa Paskalom, mozda i veci i to govorim ako ostane u istom nm procesu. Ako se predje na 10nm, napredak koji je Paskal doneo ce se prevazici.
 
Pascal i jeste izasao sa HBM-om (GP100). GP104/GP106 su i projektovani za GDDR5(X), nije tu bilo nikakvih promena. Sigurno nisu dizanirali chip za HBM i onda u jednom trenutku rekli - ej ovaj HBM je jos uvek nedostupan u vecim kolicinama a i skup je hajde da prepravimo za GDDR5.

Takodje vezano za Maxwell, cesto se prica - "Maxwell je pravljen za nizi proizvodni proces". Odakle nam ovo? Jel neko (nVidia) to potvrdio ?

Druga stvar je sta smo mi dobijali od informacija kako je vreme odmicalo ali to ne znaci da se prica (dizajn) tako i menjala.
 
Izasla je samo Tesla. Quadro je sa GDDR5X.

Po zvanicnom Envdija obavestenju Paskal je trebao da ide sa HBM ukljucujuci i GP104. Ovo sto pominjes da je GDDR5X projektovan za GP104 nije apsolutno tacno
jer tada GDDR5X nije ni bio u planu i takva tehnologija nije uopste postojala.

A sta je sa GP102? To si zaboravio? Kako god okrenes morali su da odrade neke promene.

Za Maksvel takodje, zvanicno obavestenje od strane Envidije je da je Maksvel trebao da bude u 20nm da bi se kasnije prebacio u 28nm jer se ispostavilo da je 20nm pokvaren sto implicira
da su se testovi radili i da finalni rezultat kao produkt nije bio dobar.
 
Poslednja izmena:
Izasla je samo Tesla. Quadro je sa GDDR5X.

Po zvanicnom Envdija obavestenju Paskal je trebao da ide sa HBM ukljucujuci i GP104. Ovo sto pominjes da je GDDR5X projektovan za GP104 nije apsolutno tacno
jer tada GDDR5X nije ni bio u planu i takva tehnologija nije uopste postojala.

A sta je sa GP102? To si zaboravio? Kako god okrenes morali su da odrade neke promene.

Za Maksvel takodje, zvanicno obavestenje od strane Envidije je da je Maksvel trebao da bude u 20nm da bi se kasnije prebacio u 28nm jer se ispostavilo da je 20nm pokvaren sto implicira
da su se testovi radili i da finalni rezultat kao produkt nije bio dobar.

Nadji mi ova zvanicna obavestenja da je GP104 trebao da ima HBM2 i da je Maxwell trebao da bude u 20nm :)

GP102 je takodje razvijan paralelno. Ovo je prvi put da su razvili poseban GPU (GP100) koji se koristi iskljucivo za HPC.
 
Google is your friend :)

Imao si njhov roadmap pa pogledaj, to ti je dovoljno, za ostalo se snadji :)

Poenta je da se pripreme i testovi odvijaju tako da nista nije nemoguce i da na kompromise moras da racunas ukoliko neka karika pukne.
Uostalom, ovo sto pricam o prilagodjavanju arhitekture imali smo kroz primer sa Fermijem, GTX 480 i GTX 580. 40nm proces. Dalje ne treba nista da govorim.

GP102 se isto tice ove price jer se radila rekonstrukcija i jer ste vi tvrdili da je to nemoguce, da se odvajaju dva cipa itd. Da ne duzim, znate i sami sta ste pisali.

Takodje, treba imati na umu da je i Paskal uleteo "neplanski" bar ne po zvanicnom roadmapu. Stvari se menjaju u hodu ;)
 
Poslednja izmena:
Nema sta da guglam, siguran sam da nVidia nije davala nikakvo obavestenje vezano za recimo to da ce GP104 imati HBM memoriju, stavise, sve do pojave GTX 1080 i izbacivanja whitepaper-a kodno ime chipa se ne spominje zvanicno od strane nVidia.
Drugo su nagadjanja i leak-ovi.

Za GP102 nisam rekao da je nemoguce vec sam bio uveren da ce iskoristiti GP100 za ovo sve za sta ce sada koristiti GP102 jer su tako uvek radili do sada. Ovo je prvi put da su razvili poseban GPU samo za DP i ostale HPC stvari a poseban GPU koji je zapravo 'ociscen' od high-end HPC stvari.

Jedino sto su zvanicno objavili jeste roadmap sa kodnim imenima arhitektura i udarnim feature-om za svaku. Tako je ispod Pascal-a stajalo HBM2 i to su i isporucili.
 
Poslednja izmena:
Pa ti tumacis kako se tebi svidi.

To moze da se posmatra i ovako. Najavili su HBM2, dobili smo GDDR5X. Tesla me ne zanima i to je sasvim druga prica. Slazem se da je to lepo videti ali nista od prakticnog udela za geforce karte.

Poenta cele price je da su oni skloni promenama i manipulacijama.
Sto se tice promena, tu se veoma brzo adaptiraju i prilagode, za to im svaka cast a ovo drugo necu da komentarisem.

P.S. Mislis stajalo? :)
 
Poslednja izmena:
A to su nagadjanja novinara, moraju nesto da pisu i ovako nista ne rade :D
 
Nazad
Vrh Dno