Šta je novo?

AMD Piledriver a.k.a. Vishera, official thread

Evo sta kaze Dark Shikari x264 developer:
Some changes are already up on github. Don't expect much, maybe 1-2%; microarchitecture changes are vastly more important and valuable than new instructions, particularly in an application with functions as complex and diverse as x264.
...sto se uglavnom poklapa sa onim o cemu sam pricao. Dzaba ti instrukcije kada nemas hardver na kojem mozes da ih izvrsis.
 
The new Pilediver core should result in higher core performance at the same clock compared to Zambezi core and should have increased power efficiency, resulting in lower heat output.

Zbog cega se istice ovo ako ne zbog odredjenog napretka i razlike u odnosu na Bulldozer?!
Upravo ono o cemu sam gore pisao ;)
 
@hexenbiest:

Sva ta rešenja su ko traženje vode bajalicom. Za verifikaciju rada CPUa ( i ne samo CPUa nego celog sistema!) su ti potrebni kompleksni alati koje ti nemaš. I pored njih ti je potreban dostup do diagnostičke elektronike na samom CPU dieu, koji ti, naravno, nemaš.

Bez toga je sve ostalo igra za decu.
Ako pričamo o kompu za kućnu upotrebu, igranje, pa i rendering, ne vidim nikakav razlog zašto CPU ne bi bio overklokovan u nekim razumnim granicama gde se to isplati. A što se tiče verifikacije stabilnosti, ne možeš nikada biti 1000% siguran da CPU neće pokazati neki BUG zbog overkloka, ali ako CPU prolazi sve burn in testove sa odgovarajućim hlađenjem nema razloga da taj CPU ne radi većim frekvencijama od fabričke. Uostalom sam AMD implementira turbo mod na 4.2 GHz. Ako bilo koje jezgro t.j. modul radi bez frke na tih 4.2 GHz sa stock hlađenjem, nema nikakvog razloga da ceo CPU ne radi sa adekvatnim hlađenjem na istih 4.2 GHz za sva jezgra.

Što se RAID6 tiče, nisi u pravu. XOR je paritet za RAID5. Ekstra paritet za RAID6 se izračunava daleko teže a regeneriše još mučnije.
XOR operacija se koristi itekako i u RAID6 za računanje osnovnog pariteta, ali drugi deo algoritma koristi paritet zasnovan na jednoj algebarskoj strukturi - Galois-ovom polju. A baš me zanima kako ćeš da optimizuješ taj alogitam da ne poseduje "data dependenies"?

Ok.... neću da te cimam više, pošto nemaš vremena za duge debate. Pozz! :wave:
 
Poslednja izmena:
Ako pričamo o kompu za kućnu upotrebu, igranje, pa i rendering, ne vidim nikakav razlog zašto CPU ne bi bio overklokovan u nekim razumnim granicama gde se to isplati.

A ja sam ga našao nekoliko puta. I time stvorio seb toliko problema da mi se zgadilo. Koliko je samo bilo priča o OCu Phenoma i dobicima overklokovanjem front-busa, pošto je na njegovu frekvenciju vezan i L3. CPU je nebrojenom puta prošao sve testove bez ikakvog problema, čak i na dugotrajnijim testiranjima. Da bih 6 meseci kasnije našao MASU pokvarenih fajlova i *****a u filesistemu. I to masu koja metastazira i polako raste. I masu korisnika sa istim problemom.

A što se tiče verifikacije stabilnosti, ne možeš nikada biti 1000% siguran da CPU neće pokazati neki BUG zbog overkloka, ali ako CPU prolazi sve burn in testove sa odgovarajućim hlađenjem nema razloga da taj CPU ne radi većim frekvencijama od fabričke.

Ako u isto vreme priznaješ, da ne možeš biti 100% siguran u stabilan rad i tvrdiš da uz to ne vidiš nikakav razlog protiv OC, onda si iracionalan.

Uostalom sam AMD implementira turbo mod na 4.2 GHz. Ako bilo koje jezgro t.j. modul radi bez frke na tih 4.2 GHz sa stock hlađenjem, nema nikakvog razloga da ceo CPU ne radi sa adekvatnim hlađenjem na istih 4.2 GHz za sva jezgra.

1. TO NIJE ISTINA. Ima pa jedno 100 potencialnih razloga. Recimo pad napona i ripple u kojekkakvim internim mrežama za napajanje.
2. AMD je za te frekvencijske raspone štelao kojekakve interne stvari, recimo prednaponska kolena na getovima tranzistora u kritičnim sklopovima, kvaltet napojnih mreža, jačinu drajvera itd.
3. AMD čipove i testira za te frekvencijske raspone
4. Pod "testira" ne mislim to, da na kraju trake stoje Mujo i Haso sa SuperPi i Memtest86 nego se stvari testiraju kroz nebrojene TAJNE alate, uz posebno izgrađen HARDVER, koji nikada neće izaći iz AMD-a i uz pomoć za to predviđenih TAJNIH struktura NA ČIPU.
5. Svi ti testovi imaju težnu tek psle simulacija i dokaza da čip koji prođe TE testove u TIM uvetima stvarno radi prema specsima.
6. Elektrolliti na motherboardu, ma šta reklame govorile o njima, su potrošna roba. Ogromne i stalne strujne špice jih stalno pomalo jedu. Prilikom OC-a te špice uveliko skaču i jako skraćuju njihov životni vek.
7. Prilikom OCa ti trošiš rezervu u elelktrolitima koji sada moraju da rade bliže svojim granicama a pošto njihov učinak opada, trebaće manje da sistem počne da pravi greške. Po svojoj pirrodi te greške će biti najpre retke i prikrivene a onda _polako_ sve češće i izrazitije.

XOR operacija se koristi itekako i u RAID6 za računanje osnovnog pariteta, ali drugi deo algoritma koristi paritet zasnovan na jednoj algebarskoj strukturi - Galois-ovom polju.

Pa koristi se negde i možda i NOP ili jednostavno učitavanje immediate konstante u registar. Ili množenje sa dva šiftovanjem. Naravno da su iskorstili jednostavan XOR z RAID5 za jedan od sindroma. Zašto bi računali oba preko Galoisovog polja ? Mislio sam na onaj drugi, koji otežava stvar i prestavlja 99%+ napora od rada s RAID6. Izračun RAID5 paritete ne predstavlja nikakav napor a regeneracija podataka je tako jednostavna, da mnoga SW polja to rade rutinski- ako imaš u baferu podatak N-1 diskova a treba ti onaj zadnji, izračunaš ga jednostavno XOR-ovanjem umesto da čekaš glavu diska.

Kod RAID6 sam imao priliku da vidim kako ista stvar prouzrokuje pad brzine polja sa 200+MiB/s na nekih 6-7MiB/s uz totalno gušenje CPUova za bilo šta drugo.

A baš me zanima kako ćeš da optimizuješ taj alogitam da ne poseduje "data dependenies"?

Ne znam šta tačno time misliš. Ako te zanima SSE izvedba, pogledaj u linux source.
 
Poslednja izmena:
A ja sam ga našao nekoliko puta. I time stvorio seb toliko problema da mi se zgadilo. Koliko je samo bilo priča o OCu Phenoma i dobicima overklokovanjem front-busa, pošto je na njegovu frekvenciju vezan i L3. CPU je nebrojenom puta prošao sve testove bez ikakvog problema, čak i na dugotrajnijim testiranjima. Da bih 6 meseci kasnije našao MASU pokvarenih fajlova i *****a u filesistemu. I to masu koja metastazira i polako raste. I masu korisnika sa istim problemom.
I zakljucio si da se to desilo zbog overclocka? To je isto moglo da ti se dogodi i zbog neceg drugog, npr, neispravan SATA kabl, neispravan HDD itd.... mnogo pre nego do overclocka. Da si se malo vise bavio ovom tematikom ne bi tako pricao.

Ako u isto vreme priznaješ, da ne možeš biti 100% siguran u stabilan rad i tvrdiš da uz to ne vidiš nikakav razlog protiv OC, onda si iracionalan.
Ne, racionalan sam. Rekao sam ti lepo u zavisnosti za sta koristis komp. Naravno da server neces overklokovati ili racunar gde je pouzdanost u radu ultimatum.

1. TO NIJE ISTINA. Ima pa jedno 100 potencialnih razloga. Recimo pad napona i ripple u kojekkakvim internim mrežama za napajanje.
Zato se prave kvalitetna napajanja koja peglaju takve ripplove. A i kvalitetne ploče koje takođe daju kvalitetan napon na "internoj mreži" koja se zove VRM modul.

2. AMD je za te frekvencijske raspone štelao kojekakve interne stvari, recimo prednaponska kolena na getovima tranzistora u kritičnim sklopovima, kvaltet napojnih mreža, jačinu drajvera itd.
Jeste, testira ih, ali isto tako ne pravi posebno FX8120 i FX8150. U pitanju je proizvodni proces istih specifikacija. Nekada se sami cipovi iste oznake razlikuju od serije do serije vise nego sto se razlikuju po nazivnim oznakama.
3. AMD čipove i testira za te frekvencijske raspone
Da, testira ih tako što ne testira svaki, nego svaki 10 iz određenog batch-a.

4. Pod "testira" ne mislim to, da na kraju trake stoje Mujo i Haso sa SuperPi i Memtest86 nego se stvari testiraju kroz nebrojene TAJNE alate, uz posebno izgrađen HARDVER, koji nikada neće izaći iz AMD-a i uz pomoć za to predviđenih TAJNIH struktura NA ČIPU.
5. Svi ti testovi imaju težnu tek psle simulacija i dokaza da čip koji prođe TE testove u TIM uvetima stvarno radi prema specsima.
6. Elektrolliti na motherboardu, ma šta reklame govorile o njima, su potrošna roba. Ogromne i stalne strujne špice jih stalno pomalo jedu. Prilikom OC-a te špice uveliko skaču i jako skraćuju njihov životni vek.
7. Prilikom OCa ti trošiš rezervu u elelktrolitima koji sada moraju da rade bliže svojim granicama a pošto njihov učinak opada, trebaće manje da sistem počne da pravi greške. Po svojoj pirrodi te greške će biti najpre retke i prikrivene a onda _polako_ sve češće i izrazitije.
Mislim da malo brkas pojmove. Korektnost logickih kola se verifikuje uz ne tako tajnu strukturu koja ispituje zadovoljivost logičkih funkcija i to se radi u procesu projektovanja čipa, tj. u fazi razvoja. U fazi proizvodnje čip se testira u više faza proizvodnje i na više načina, a prvo i osnovno je da se utvrdi da li ima defekata, za šta se koristi poseban alat baziran na optici. Dakle, nema razloga za ponovnim testiranjem verifikacije logičkih funkcija, jer je to izuzetno računski zahtevan posao i nema potrebe raditi ga iznova za svaki čip.
Na kraju proizvodnje se vrši klasifikacija na osnovu izmerene disipacije i testirane maksimalne frekvencije.

Pa koristi se negde i možda i NOP ili jednostavno učitavanje immediate konstante u registar. Ili množenje sa dva šiftovanjem. Naravno da su iskorstili jednostavan XOR z RAID5 za jedan od sindroma. Zašto bi računali oba preko Galoisovog polja ? Mislio sam na onaj drugi, koji otežava stvar i prestavlja 99%+ napora od rada s RAID6. Izračun RAID5 paritete ne predstavlja nikakav napor a regeneracija podataka je tako jednostavna, da mnoga SW polja to rade rutinski- ako imaš u baferu podatak N-1 diskova a treba ti onaj zadnji, izračunaš ga jednostavno XOR-ovanjem umesto da čekaš glavu diska.
Govorim za RAID6, algoritam za racunanje pariteta, prvi deo se sastoji od obicnog XOR-a, a drugi deo koristi polinomijalnu funkciju baziranu na Galoisovom polju.

Sindrom P racunas prvo kao P = D0 xor D1 xor D2 xor ..... xor Dn-1;
Sindrom Q racunas kao Q = g^0 * D0 xor g^1 * D1 xor g^2 * D2 xor ...... xor g^n-1 * Dn-1;

g ti je generator Galoissovog polja. Dakle, koriste se XOR funkcije skoro svuda. Nema potrebe dalje da ulazim u matematiku koja stoji iza ovoga, vecim delom se koristi XOR. BTW, Linux kernel koristi bas ovaj algoritam za RAID6. Komputacija Q sindroma je ono što je ovde procesorski zahtevna operacija.

Ne znam šta tačno time misliš. Ako te zanima SSE izvedba, pogledaj u linux source.
Racunanje stepena polinoma moguce je implementirati SIMD instrukcijama. Nevezano za to govorio si o tome kako optimizujes kod kada ti se ne svidja kako radi. Zbog toga sam te pitao kako izbegavas "data dependencies", jer ako se bavis tim stvarima ovo bi trebalo da znas.
 
Poslednja izmena:
I zakljucio si da se to desilo zbog overclocka? To je isto moglo da ti se dogodi i zbog neceg drugog, npr, neispravan SATA kabl, neispravan HDD itd.... mnogo pre nego do overclocka. Da si se malo vise bavio ovom tematikom ne bi tako pricao.

Da. Dokazano zbog OCa i demonstrirano na drugoj, jednakoj, baš za to sastavljenoj mašini.

Ne, racionalan sam. Rekao sam ti lepo u zavisnosti za sta koristis komp. Naravno da server neces overklokovati ili racunar gde je pouzdanost u radu ultimatum.

Ne vidim kako. U istoj rečenici tvrdiš i da razloga nema i da može da postoji.

Zato se prave kvalitetna napajanja koja peglaju takve ripplove. A i kvalitetne ploče koje takođe daju kvalitetan napon na "internoj mreži" koja se zove VRM modul.

Ti nemaš ba puno pojma o elektronici, jel da ?
Napajanje, ma kako kvalitetno bilo, ne može da ispravi ripple koji nastaje recimo u napojnom gridu samog čipa ( znači na silicijumu). Ili da otkloni posledice prevelikog šuma, koj neki signal isijava u okolne sklopove zbog visokog napona i strmih bridova itd itd.

Jeste, testira ih, ali isto tako ne pravi posebno FX8120 i FX8150. U pitanju je proizvodni proces istih specifikacija. Nekada se sami cipovi iste oznake razlikuju od serije do serije vise nego sto se razlikuju po nazivnim oznakama.

A mnogo puta se laserski trimuju koještarije na čipu prema toma da li on treba da radi kao recimo 8120 ili 8150-tica.

Da, testira ih tako što ne testira svaki, nego svaki 10 iz određenog batch-a.

Neke testove za variacije unutar serije. Kroz masu testova idu SVI.

Mislim da malo brkas pojmove. Korektnost logickih kola se verifikuje uz ne tako tajnu strukturu koja ispituje zadovoljivost logičkih funkcija i to se radi u procesu projektovanja čipa, tj. u fazi razvoja. U fazi proizvodnje čip se testira u više faza proizvodnje i na više načina, a prvo i osnovno je da se utvrdi da li ima defekata, za šta se koristi poseban alat baziran na optici. Dakle, nema razloga za ponovnim testiranjem verifikacije logičkih funkcija, jer je to izuzetno računski zahtevan posao i nema potrebe raditi ga iznova za svaki čip.

GLuposti. Koje možda važe za slučaj, da radiš svoju logiku na FPGAu ili nekom VLSIu iz standardnih knjižnica, a i to u nekoj meri. KAda rade takvu stvar "from ground up" i sekiraju se oko svih detalja i koriste masu trikova ( koji su dizajnerima logičkih kola nedostupni) imaš masu testova na čistoj analognoj i fizičkoj strani - propagacija signala, odboj, crosstalk, pojačanje tranzistora, curenje itd itd.

I opšte je poznata stvar, da te komponente imaju backdoor za testiranje. Ring oscilatori strateški raspoređeni po čipu itd itd.

Govorim za RAID6, algoritam za racunanje pariteta, prvi deo se sastoji od obicnog XOR-a, a drugi deo koristi polinomijalnu funkciju baziranu na Galoisovom polju.

I opet odgvoraš na nepostavljeno pitanje. Ne zanima me kako se izračunava drugi paritet za RAID6. To već znam. Kažem, da izračun drugog pariteta nije tako jednostavan koa izračun prvog i da ta relatvno mala petlja za njegovu generaciju ( a još više petlja za regeneraciju pdataka pomoću njega!) daleko više određuje poerformanse SW RAID6 nego sav osali kod. Zato i jeste kodirana u asembleru dobrim delom i to na više načina a prilikom inicializacije mašine rutina testira sve praktički upotrebljive subrutine i bira najbržu na konkretnoj mašini.

Racunanje stepena polinoma moguce je implementirati SIMD instrukcijama. Nevezano za to govorio si o tome kako optimizujes kod kada ti se ne svidja kako radi. Zbog toga sam te pitao kako izbegavas "data dependencies", jer ako se bavis tim stvarima ovo bi trebalo da znas.

Pa, recimo na Phenomu mi sen nije svideo rapored "Prefetch" instrukcija, pa sam ih uklonio i prema kernelovom benchmarku time ubrzao loop nekih 30+%. kasnije su uveli izračun pariteta na više jezgara ( u više threadova) ali tada sam već pičio RAID5 naveliko. Sada planiram opet preradu rutina, ali to je već druga stvar.

Što se data dependencyja tiče, nije problem. Sindrom se po prirodi stvari ( mislim praktičke izvedbe) izračunava bajt po bajt. Pošto tebi uvek treba paketić od 4K eto prilike za paralelizam kolko ti treba...
 
Poslednja izmena:
Još nešto oko tih logičkih simulatora - pa glavni trik VIshere je "resonant clock mesh".

Kako češ recimo njegov rad da odsimuliraš na logičkom testeru ispravnosti i simulatoru ?

Pa radi se o triku, koji je totalno ispod nivoa logičkih kola.
 
Poslednja izmena:
Definitivno smo skrenuli sa Piledriver teme, šta da ti kažem Brane, pametan si, samo si malo površan, a mrzi me da se dalje raspravljam o stvarima u koje nisi bas najbolje upucen. ;)
Pozz! :wave:

Još nešto oko tih logičkih simulatora - pa glavni trik VIshere je "resonant clock mesh".

Kako češ recimo njegov rad da odsimuliraš na logičkom testeru ispravnosti i simulatoru ?

Pa radi se o trku, koji je totalno ispod nivoa logičkih kola.
Da si citao malo bolje moj post video bi da je logicki simulator deo razvojne faze.
Resonant clock mesh je nesto sasvim drugo.
Problemi sa frekvencijom procesora dolaze iz nemogućnosti logičkih kola i tranzistora da isprate određenu frekvenciju sa određenim naponima i tresholdom.

Koliko znam, clock mesh se koristi radi povećanja frekvencija na kojima CPU radi. Npr. Prescott je koristio nešto slično, što je jedan od razloga enormne potrošnje koju je imao. Klok generatori raspoređeni po različitim delovima jezgra u vidu mreže čime se manje gubi na kvalitetu klok signala, smanjuje se "jitter", jer ne dolazi do gubitaka u raspodeli klok signala. Ne znam kako misle da sa ovime smanje potrošnju, osim ako ovo ne prilagode niskoj potrošnji.

AMD received Cyclos technology licensing
Recently, AMD ISSCC meeting Cyclos Semiconductor Corporation today announced its next-generation CPU processor is the latter "Resonant Clock Mesh (resonant clock network) technology licensing, the technology will enhance the" Piledriver "(hammers) APU, including the processor performance and lower power consumption.
Resonant the Clock Mesh uses electronic sensors to create an electronic clock inside the chip, known as the "tank circuit" the Cyclos sensors, and the clock control circuit recycling clock electricity rather than dissipated and wasted in each clock cycle, so you can reduce energy consumption 10 percent or more, this technology has been applied in the field of high-performance chips for many years, the cooperation is also RCM for the first time authorized the commercialization."

Navodno RCM bi trebalo da redukuje potrošnju i da poseduje benefite standardnog clock mesh-a.

16.jpg

S obzirom da se radi o rezonanci, potrošnja bi trebalo da bude normalna ili redukovana zbog toga što se umesto guranja elektrona u klok signal koristi rezonantno svojstvo, a ovo opet troši nultu energiju umesto klasične klok generatorske mreže. Npr, svaki materijal ima svoju frekvenciju rezonance, e sad ne znam kako je ovo izvedeno, s obzirom da je frekvencija procesora varijabilna, npr. idle je 800 MHz, dok je turbo 4200 MHz itd...
 
Poslednja izmena:
Definitivno smo skrenuli sa Piledriver teme, šta da ti kažem Brane, pametan si, samo si malo površan, a mrzi me da se dalje raspravljam o stvarima u koje nisi bas najbolje upucen. ;)

Verovao ili ne, to me ne zanima. Malo sam se izgleda, razmazio slovenačkim slo-tech forumom. Navikao sam da je jedino važno na forumu mišljenje a ne njegov vlasnik.
I da je debata korisna stvar za filtiranje slabih ideja. Sretnemo se ti i ja, i ti dobiješ priliku da ubiješ moje slabe ideje a ja tvoje.

Kod svake ideje ja tako mogu da dobijem tvoju potvrdu ili da ju ubije tvoja bolja ideja. U OBA slučaja imam korist - informaciju, koju prije nisam imao.

I tako zađem korak levo ili desno sa slo-tech.com kad ono... STALNO omirisivanje muda, oštrenje kurčeva i plemenski ratovi. Gde ti je bio deda ( da o ocu ne pričamo, to je takoreći sadašnjost !) i plemenski DNK određuju SVE debate čak i u elektronskom Balkanu.

MOje znanje je široko a dosta plitko. BIo sam u masi stvari, u nijednoj se nisam zadržao.

Što kažu

"Jack of all trades, master of none"

ali prećutkuju kurve

"But nine times of ten, better than master of one"

Da si citao malo bolje moj post video bi da je logicki simulator deo razvojne faze.

ali tvoj argument je bio "pa šta, imaju logički simulator". To ti je kao da kažeš milicija može da se nosi sa svakim problemom pošto milicioner ima pendrek.

Resonant clock mesh je nesto sasvim drugo.

Tačno. A ujedno i najnoviji u doigoj listi razloga zašto logički simulator nije ni priibližno dovoljan za hvatanje svih ( čak ni logičkih !) problema. Pogledaj samo njihove erratume i sve će ti biti jasno.
ZAšto oni logički nisu uhvačćeni logičkim simulatorom ? A šta ćemo tek sa onim tipa "priliikom buđenja iz sleepa u sitaciji XYZ uz predhodni uslov W i sadržaj ćelije X u kešu A intenri PLL ne startuje dovoljno brzo pa dolazi do pogrešnog izvršavanja ODREĐENOG sleda instrukcja FGHL" ?

Problemi sa frekvencijom procesora dolaze iz nemogućnosti logičkih kola i tranzistora da isprate određenu frekvenciju sa određenim naponima i tresholdom.

I/ili u određenom temperaturnom rasponu i sa određenom dozvoljenom disipacijom. Clock network korsti nemali procenat sve energije zato šo se prostire preko celog čipa, a traži izuzetno dobar signal sa malim kašnjenjima i malom razlikom u fazi.
 
Poslednja izmena:
Ljudi dal se zna na koje ce maticne ploce moci Piledriver.Planiram kad izadje mozda da ga uzmem hteo sam ja i buldozera da uzmem al sam odustao koliko je uprskao.Moja ploca je Gigabyte GA-990XA-UD3 dal ce moci na nju sta mislite.
 
Sav sam se preznojio od tenzije....
 
Još nešto oko OC-a s moje strane, pošto koliko vidim, nije bilo pomenuto.

Postoje dva tabora. Prema prvom, svako friziranje vodi ka kazni u ovom i večnoj patnji u sledećem životu. prema drugom, to je jedini način na koji Pravi Muškarac koristi kompjuter.

Prema njihovom učenju svi čipovi dolaze u odeljenje za binning ( određivanje brzinske grupe čipova ) gde, verovatno zbog osećaja za grafički dizajn ili čega već, rade PEDERI.
Oni konstatno sjebavaju profit firme i krajnje konezrvativno ocenjuju čipove, verovatno i zato da bi Pravi Majstori posle došli do izražaja.

Realnost je u tome, da bi firme,d a mogu vrlo rado binovale čipove više. Ali one vrlo dobro znaju šta određeni čipovi mogu kroz ZAHTEVANE TERMIČKE i ELEKTRIČNE USLOVE.

I to je to. Ti možeš recimo da suziš termičke uslove ( pičiš na nižim temperaturama) i/ili koristiš bolje kondenzatore na ploči ali moraš da se pomiriš sa tim, da ti te komponente NE MOŽEŠ NIKADA u toj kombinaciji da istestiraš kao što je to uradio proizvođač za stock. Tako nikad ne možeš da znaš da stvar stvarno radi 100%. Ako ti je to OK i ako imaš načina da istestiraš konačan rezultat, onda OC ZA TEBE može da bude OK, što da ne.

I još nešto oko onog "ja pičim OC i meni to radi". Masa tih izjava potiče od krajnje široke publike i njihov pojam "to radi" krajnje varira ali praktično nikad nije naročito visoko. Obično su pod pressingom da mogu da se pohvale, pa se "to radi" svodi na "mašina mi se u tih pola sata nije vidljivo srušila".

Još nešto oko Phenoma i L3. zanimljivo kod L3 keša (a malo pominjano u javnosti ) je to, da:

-L3 je vezan na radi na frekvenciju memorije a ne CPUa kao L1/L2
- latencija L3 bitno zavisi od toga u kojoj banci je podatak. L3 je očigledno sastavljen iz više banki ( verovatno 4*N, gde je N verovatno 1) i svaki core ima lokalnu, malo manje lokalne i najmanje lokalne banke.

Ko je pratio razvoj Phenoma, primetio je,d a je PH II imao SPORIJI takt L3 ( ali uz malo manju latenciju, pa se svelo na približno isto). Objašnjenje u medijima je bilo da je AMD jednostavno povećao broj pedera u timu, koji je donosio takve odluke. UBrzo su se pojavili Pravi Muškarci kojima je "to radilo" i sa originalnih 1,8GHz na 2,4 pa i 2,6GHz.

Ispostavilo se da njima "to radi" znači jednostavno "neopterećeni Winsi se ne ruše". Ja sam odma našao situacije na kojima to jednostavno pada kod 2.4GHz. Kod 2,2GHz te situacije nisu bile očigledne, ali su se nakupile. A i tada su neki od onih kojima je to jednostavno radilo do tada već počeli da plaču, pa sam batalio stvar i vratio na stock. I uz jedno pola flaše žestokog pokušao da zaboravim koliko vremena sam tako "uštedio" sa OC.

L3 se ukratko ne ponaša kao L1/L2 i sa njim je bitno teže diagnostikovati probleme zbog svih mogućih interakcija. L1 i L2 su privatni per core. L3 je zajednički i između ostalog, baš namenjen intercore komunikaciji.

Baš šteta. Phenom baš vidljivo živne sa bržim memory clockom jer time ne ubrzavaš samo memoriju nego L3...
 
Stil pisanja ti je malo naporan :D Uvek se vodila rasprava oko overkloka, ja sam za onaj umereniji koliko je god moguce na def naponu uz malo bolje hladjenje. Odsrafljivanje napona i kloka trazi dobro hladjenje, elementi na ploci se daleko vise greju, potrosnja se ekponencijalno povecava i sve je teze ubosti parametre na kojima ce CPU biti "potpuno" stabilan.

L3 kod AMD-a ne radi na frekvenciji radne memorije, vec na frekvenciji IMC-a.
 
Da, pardon. MIslio sam IMC. Ali i taj jeste u vezi s frekvencijom memorije IIRC...
 
Ljudi, molim vas, hajde da se vratimo temi. Previše ste odlutali od glavne teme, a tema je Vishera, ako ste zaboravili. Ako nešto znate, konkretno, Brane213 i hexenbiest, o arhitekturalnim poboljšanjima u Piledriver jezgru u odnosu na BD, pišite o tome. Hvala na razumevanju.

Mislim, ja duboko cenim sve ovo što ste napisali i lepo ste sve to rekli, svaka vam čast na stručnosti, vama dvojici. ,) Ali sad je vreme da se osvrnemo na ono što će zaista novo doneti Vishera. :)
 
Pa praktično sve o tome je već rečeno. Mala poboljšanja tu i tamo koja bi trebala u povišeni takt da se sastave u nešto izmerivo i to je to.

Šta ti očekuješ ?

Mislim, meni je Bulldo sasvim simpatičan ali iskreno govoreći još ni Phenom ne koristim u potpunosti pa prema tome nisam ni nešto posebno oduševljen. Ne treba mi (još).

Zgodan dodatak je crypto engine, koji bi znao da dođe jako dobro kod recimo kriptiranja diskova. To bi mi palo ko kec na desetku ali i to samo na serveru a tamo bi opalio Trinity a ne klasični CPU.

Za sve ostalo mi je Phenom sasvim OK. Da mi crkne, bio bi to dober izgovr za upgrade ( i to Bulldo 1 ili 2) ali da mi treba, ne treba mi.

MOžeš sad ti da odvališ duge rasprave o AVX itd itd ali gde ćeš to videti u realu ? Dobro, fino je imati to ali dalek od razloga za kupovinu samo za sebe.
 
Da, pardon. MIslio sam IMC. Ali i taj jeste u vezi s frekvencijom memorije IIRC...
Brane, lupetaš gluposti ko "maksim po diviziji" i ne želim da se raspravljam sa tobom više, mnogo si bre sujetan, a praviš se da sve znaš.
IMC je deo integrisanog northbridgea u AMD procesorima. Northbridge sadrži u sebi L3 cache, IMC i HTT link(ove). Njegova frekvencija je u Phenom II procesorima 2 GHz. Frekvencija memorije nema veze sa frekvencijom northbridgea.
Jedino šta ima veze jeste DCT - dram controller, koji je interfejs za rad sa memorijom i predstavlja kontrolersku logiku za određeni tip memorije, npr. DDR2, DDR3 i on radi na frekvenciji memorije i to je tako u svakom procesoru, bez obzira da li L3 i NB rade na frekvenciji CPU-a kao sto je slucaj kod Sandy Bridgea i K8 ili rade na 2 ili 2.2 GHz kao sto je slucaj kod Phenoma II i Bulldozera.

Ubuduce se izrazavaj malo preciznije. :)

Evo ti i slika pa se edukuj malo:

pic6.jpg
 
@hexenbiest:

Ti detalji su mi nebitni. Bitno mi je, da je L3 CLK nije jednak Core CLK, pa zbog toga:

- treba takt ili dva za sinhroniziaciju ( BTW: čiji takt CPU ili IMC CLK ?)
-njegova latencija u taktovima nije uvek jednaka čak i kada se radi o istoj banci.

Pored toga, politika ekskluzivnosti podataka je tu kod L3 promenjena sa namerom omogućenja brze intercore komunikacije.

Sve to unosi nove izvore grešaka koje je dosta teško detektovati.
 
Treba malo više za sinhronizaciju, s obzirom da je vreme pristupa L3 SRAM memoriji znatno veće nego L2 npr. Tu moraš da uračunaš i victim buffere koji se koriste za komunikaciju između keša različitog nivoa. Konkretno vreme pristupa u L1 kešu je fiksno i iznosi 3 ciklusa, dok je u L2 kešu takođe fiksno i iznosi 15 ciklusa kod K10 arhitekture, dok kod BD iznosi 4 ciklusa za L1, odnosno 20 ciklusa za L2. L3 kod oba ima latenciju oko 35-50 procesorskih ciklusa u zavisnosti od brzine jezgra i brzine northbridge-a.
S obzirom na to da AMD koristi ekskluzivnu keš arhitekturu, što znači da se podaci iz L1 ne nalaze u L2, ili u L3 osim ako nisu potrebni za koherenciju jezgara. Ipak, u bilo kojem slučaju da bi se pristupilo kešu višeg nivoa, procesor mora da prođe 8 blokova upisa u victim write buffer. Tako npr. K10 ima latenciju L2 keša 11-12 ciklusa + 64*8/128, gde je 64 bajta keš linija, 8 je broj bita u bajtu, a 128 je brzina transfera u bitovima, prilikom upisa u L2 keš. Tako dolazimo do latencije od 15 ciklusa.
Što se tiče L3, tu opet nema nikakve magije, osim što je veza ostvarena preko internog crossbar interfejsa, koji postoji i u K8 procesorima.

L3 je tu da bi se ostvarila bolja sinhronizacija thread-ova, mada to u praksi vrlo malo utiče na performanse. L3 je tu između ostalog da poveća prosečni hit rate celokupne keš arhitekture. Uostalom, Phenom II je brži od 0-15-tak % u single thread operacijama, klok za klok, od Athlona II koji nema L3. U multithreadu je još nešto malo veća razlika, naravno u zavisnosti od toga koliko data aplikacija uopšte traži memorijski i keš pristup.

Tačno je da kompleksnost dizajna utiče na broj mogućih grešaka i to eksponencijalno, međutim razloga za npr. korupciju podataka ima zaista mnogo. Konkretno, imam godinama u različitim konfiguracijama overklokovane procesore i to radi uglavnom korektno za kućnu primenu, i zaista mi se nikada nije desilo da mi overklokovan procesor napravi brljoke po HDD-u. Naravno, dešavalo se svašta u slučajevima preterivanja, npr. BSOD, korupcija registry-ja na Windowsu itd... i to uglavnom na starijim konfiguracijama sa lošom memorijom. Opet, naglašavam, ovo se dešavalo na lošim konfiguracijama, gde se preterivalo sa overklokom.
Opet, imam hiljadu primera gde procesor radi godinama overklokovan i nikada se ni jedan jedini bug nije desio, a i čak ako je i bilo nešto, to nije bilo do overkloka, već je bilo potpuno druge prirode.
Daću ti svoj primer gde je Phenom II X6 1100T koji je stock 3.3 GHz i turbo na 3.7, radio na 3.6 GHz za sva jezgra i turbo na 4. Pri tom je RAM radio na 1866 MHz i northbridge na 2800. Za 2 godine, na adekvatno podešenim setovanjima se nije dogodio ni jedan sumnjiv bug, a da ne pričamo o korupciji podataka.
Na konfiguraciji je vožen RAID0, gomila diskova, a kasnije i SSD. Konfiguracija ima kvalitetno Corsair HX napajanje i Megashadow hladnjak.
Komp je korišćen za svašta, počev od programiranja, preko virtuelizacije do klasičnog gaminga i korišćenja u raznim operativnim sistemima.
Od drugara kućni desktop, Athlon 64 X2 3800+ 90nm F3 jezgro, uboden u Biostarovu 770 plocu, adekvatno hlađen, umesto na 2 GHz, radi od 2008. na 3GHz. Takođe ni jedan jedini problem izuzev napajanja koje je promenio, a koje je ionako bilo matoro.

Možda ćeš reći da sam kontradiktoran, ali ne...samo nisam striktan po pitanju overkloka. Da se razumemo, smatram da ne treba baš sve overklokovati, ali opet, oc. u razumnim granicama je isplativ i prilično bezbedan. S obzirom da mi je kroz ruke za poslednjih 15tak godina prošlo zaista mnogo hardvera i da se tu radilo sve i svašta, znam tačno o čemu pričam.

Imaš s druge strane grupu korisnika, entuzijasta koji se bave overklokom iz sporta i razonode. Na kraju krajeva, to je vrlo skup sport i u suštini predstavlja ekstremni test za proizvođače hardvera, konkretno procesora, ploča itd... Niko normalan ne koristi za svaki dan tečni helijum da bi hladio CPU i GPU.
Suštinski gledano ako nešto ima visoku overklok marginu, velika je šansa da će imati veliku pouzdanost na stock frekvencijama. Naravno, ne mora da bude uvek tako, ukoliko postoje bug-ovi koji su zaobišli fazu verifikacije samog dizajna.
Intel i AMD na svojim heppeninzima, tipa IDF i slično organizuju overklok sesije gde se demonstrira dostignuće u njihovoj poluprovodničkoj tehnologiji.
 
Evo FANTASTIČNIH vesti za sve one koji imaju AM3+ ploče i plašili su se, do sada, da Vishera neće raditi. Ali danas je potvrđeno da će Visgera 100 % raditi na svim AM3+ pločama, što je odlična vest.

http://news.softpedia.com/news/AMD-...tible-with-Current-AM3-Platforms-283092.shtml

Takođe, AMD je, izgleda, čvrsto odlučio da SB950 southbridge i ceo 990FX čipset ostane na tržištu do sredine 2013. godine, dakle 1090FX čipset je ili otkazan ili odložen za vreme kad izlazi Steamroller CPU.

http://www.fudzilla.com/home/item/28082-amd-sb950-to-last-until-mid-2013
 
Poslednja izmena:
Hehe. Tako je bilo i sa Phenomom II. Bio je 100% kompatibilan sa svim postojećim AM2+ i čak i AM2 bordovima.

Koliko od tih bordova je u praksi videlo BIOS update za njega ?

Ne budi naivan. Šta dobijaju proizvođači bordova besplatnim BIOS upgradeom ?

Naravno da će da ti uvale novi bord.
 
Evo FANTASTIČNIH vesti za sve one koji imaju AM3+ ploče i plašili su se, do sada, da Vishera neće raditi. Ali danas je potvrđeno da će Visgera 100 % raditi na svim AM3+ pločama, što je odlična vest.


Dzabe kad skok u performansama verovatno nece vredeti razlike u ceni.
 
Vredeće sigurno, očekuje se barem 20 % bolje performanse Vishera procesora u odnosu na Bulldozer. Taman će se tada pojaviti i osvežene ploče za 990FX čipset sa novim mogućnostima, pa ko planira kupovinu novog AMD kompa tada imaće odličan izbor.

Naravno, od novembra nadalje, dok sve to uđe u prodaju u Srbiji.
 
Zbog 20% u kupovinu ? Nema teorije, bar za mene. Možda, u sledećoj generaciji, kad i ja malo "sazrim" pa postanem sposobniji ali sada nikako.

Nije više vreme da se proci i bordovi menjaju ko gaće...
 
Pa nažalost nije...šta da se radi. Ali definitivno nećeš imati izgovora da ne kupiš Steamroller, on će biti značajno unapređen i verovatno će predstavljati odstupnicu AMD-a ka još boljim procesorima u budućnosti, kao npr. Exavator i Devastator.

Moram mali off-line, molim moderatorima da ne zamere: brane213, šta misliš da li će Steamroller NAPOKON doneti novo procesorsko podnožje i podršku za barem trokanalnu memoriju ?
 
Poslednja izmena:
Re: Upgrade - bar za mene, nisam siguran. Ići ću na upgrade tek kada mi postojeći 955BE postane pretesan.

Što sada ni slučajno nije.

Re: steamroller- nemam pojma. Više kanala ne nosi nužno neke pogodnosti. Fino je da moežš da prikačiš više memorije, ali su bord i čip skuplji. Danas za neke Intel GHZ screamere niko više i ne gleda LGA2011. Ljudima i ne treba ni široka ni posebno velika memorija, bar zasad.

Što se napretka kojekakvih rolera i steamera u budućnosti tiče, mislim da će ići ka oblikovanju jezgra prema daleko paralelnijim potrebama i da per-core performace neće ići daleko, ako ikamo ali će biti više coreova.

Ja daleko nestrpljivije čekam naslednika Trinityja nego drivere steamere i rolere.

Moja sledeća kombinacija će biti daleko više zasnovana na APUju uz poneki CPU ili GPU ali to samo kao teška artiljerija za specijalne potrebe.

Ovih dana se zezam sa Corebootom. Ako ga upenalim za svoj bord ( MSI 790GX-G65 AM3) možda ubodem čip iz znatiželje, ali vrlo verovatno neću ići u to. Osim ako mi nešto ne crkne, naravno.
 
Poslednja izmena:
Ja smatram da u postojećih 32nm neće gurati više od 4-5 modula po jezgru, odnosno više od 8-10 jezgara. Server platforma je nešto drugo. Npr. moguće je da će u ponudi biti MCM modul sa 2 čipa po 5 modula,t.j. 20 jezgara. Sa 4 socketa imaćeš 80 jezgara po ploči, što je odlično za ovu primenu. Za desktop, APU itd... bitne su single thread performanse, odnosno, per-core performanse.
Piledriver će ovde biti brži klok za klok 15-20%. Ovo je moguće izvući peglanjem "uskih grla" koje poseduje BD mikroarhitektura. Evo poređenja u single thread testu BD vs Trinity:
edc85148-35ef-4942-9730-14cee3ec6ba2.jpg
a26be85f-68ce-4214-8f9f-dcdc839b798b.jpg
Uzmi u obzit i to da Trinity nema L3 cache. Vishera bi mogla još par % da bude efikasnija.
Ako se na tih 20% dobitka u performansama uzme i niži TDP, kao i viši klok, dobijamo platformu koja će mnogima biti isplativ upgrade. Npr. tebi ne treba ništa bolje od PhII 955, ali nekome ko se bavi video obradom i ko renderuje i te kako treba. Pri tom ta platforma treba da bude jeftinija od Intelove ili da daje više za iste pare.
Cenim da će razlika između PD i BD biti daleko veća nego što je svojevremeno bila između Phenoma I i Phenoma II. Mada ako se malo osvrnemo u prošlost, Phenom I klok za klok nije bio mnogo sporiji od Phenoma II, ali je radio na niskim frekvencijama. Razlika u IPCu je bila 6%, ali u frekvencijama je bila oko 15%. PD ce verovatno imati oko 5% vece frekvencije i 15-20% veci IPC.

Steamroller bi mogao da bude još jedan korak napred po pitanju "dotezanja" mikroarhitekture. Problem sa AMDom je u tome što nisu u stanju bili da odmah izbace efikasnu mikroarhitekturu, nego samo koncept koji će usput da unapređuju.
Za većinu korisnika je opet mnogo bolje da imaju 4-6 brzih jezgara, nego 8-12 sporih. Mislim da AMD na tom polju ima dosta da uradi.

Što se tiče dodavanja memorijskih kanala, tu nema neke vajde na desktopu. Za sada imaju G34 platformu koja ima 4 memorijska kanala po socketu, a ne vidim da će im trebati mnogo više u skorije vreme. Eventualno sa Steamrollerom, možda dođe i podrška za DDR4.
 
Poslednja izmena:
Vrh Dno