Šta je novo?

AMD Ryzen™ 5000 (Zen 3)

Asus je izbacio nove BIOS-e sa AGESA 1201 kiji između ostalog ispravljaju USB "bug"


AGESA 1.2.0.1 now arriving in public BIOSes for Ryzen 5000 Series! 1) Fix: False SMART errors on Hynix NVMe 2) Fix: Intermittent SSD detection for M.2 SATA devices 3) Improve L3$ bandwidth in AIDA64 4) Improve stability if user disables cores on 5600X/5800X with AMD Ryzen Master
 
Evo jos dva zanimljiva stress testa:


Uglavnom sam i provrteo da proverim stabilnost i da vidim potrosnje i temperature. Mislim da cu da ostanem na ovim podesavanjima:
PPT: 165W
TDC: 115A
EDC: 140A
Max boost: +100MHz (5050MHz)
Scalar: Auto
Curve Optimizer: -15, all core
UEFI je F33e sa AGESA 1.2.0.1

Za sada, niti jedan BSOD i problem. Probao sam sinoc malo Assetto Corsa i procesor radi na 4900MHz sa tendencijom da pada po 25MHz kako temperatura pocne da raste.

@CountMike, zar ne bi trebalo da AGESA 1.2.0.2 resi USB probleme? Koliko videh, najavljeni su BIOSi za pocetak Aprila.
 
...za koju si naveo da ispravlja usb bug, sto nije slucaj ;)
 
Za sada, niti jedan BSOD i problem. Probao sam sinoc malo Assetto Corsa i procesor radi na 4900MHz sa tendencijom da pada po 25MHz kako temperatura pocne da raste.

Na zalost, prvi problem. Pustio sam juce Blender na Linux-u i na sestoj sceni je prestao da radi:


Mar 19 18:35:38 HAL9000 kernel: [ 1319.593288] mce: Uncorrected hardware memory error in user-access at 6c53f0408
Mar 19 18:35:38 HAL9000 kernel: [ 1319.593294] mce: [Hardware Error]: Machine check events logged
Mar 19 18:35:38 HAL9000 kernel: [ 1319.593297] [Hardware Error]: Uncorrected, software restartable error.
Mar 19 18:35:38 HAL9000 kernel: [ 1319.593299] [Hardware Error]: CPU:23 (19:21:0) MC0_STATUS[-|UE|MiscV|AddrV|-|-|-|-|Poison|-]: 0xbc00080001010135
Mar 19 18:35:38 HAL9000 kernel: [ 1319.593301] [Hardware Error]: Error Addr: 0x00000006c53f0408
Mar 19 18:35:38 HAL9000 kernel: [ 1319.593301] [Hardware Error]: IPID: 0x001000b000000000
Mar 19 18:35:38 HAL9000 kernel: [ 1319.593302] [Hardware Error]: Load Store Unit Ext. Error Code: 1, An ECC error or L2 poison was detected on a data cache read by a load.
Mar 19 18:35:38 HAL9000 kernel: [ 1319.593304] [Hardware Error]: cache level: L1, tx: DATA, mem-tx: DRD
Mar 19 18:35:38 HAL9000 kernel: [ 1319.593390] Memory failure: 0x6c53f0: Sending SIGBUS to blender:15068 due to hardware memory corruption
Mar 19 18:35:38 HAL9000 kernel: [ 1319.593393] MCE: Killing blender:15069 due to hardware memory corruption fault at 7fd89ef0b504
Mar 19 18:35:38 HAL9000 kernel: [ 1319.593396] Memory failure: 0x6c53f0: recovery action for dirty LRU page: Recovered
Mar 19 18:35:38 HAL9000 kernel: [ 1319.593398] MCE: Killing blender:15088 due to hardware memory corruption fault at 7fd89ef0b2a0
Mar 19 18:35:38 HAL9000 kernel: [ 1319.593401] MCE: Killing blender:15065 due to hardware memory corruption fault at 7fd89ef0bb10
Mar 19 18:35:38 HAL9000 kernel: [ 1319.593513] MCE: Killing blender:15085 due to hardware memory corruption fault at 7fd89ef0b5f4

Slicno je i na Windows 10:


A fatal hardware error has occurred.

Reported by component: Processor Core
Error Source: Machine Check Exception
Error Type: Bus/Interconnect Error
Processor APIC ID: 24

The details view of this entry contains further information.

Da stvar bude intersantna, u vecini slucajeva ceo test prodje OK dok se ponekada desi ovaj problem tako da ga je testko uhvatiti. Sve sugerise da je u pitanju 12-to jezgro. Problem je sto ovo nisam uspeo da reprodukujen ni pod OCCT ni pod Prime95 sto samo govori da su dobri samo za preliminarno testiranje stabilnosti. Obzirom da je CO podesen na all core, precicu na per core i smanjicu magniture na problematicnom jezgru pa nazad za crtaci sto.
 
Nemoj *******i da te cuje :ROFLMAO:
 
@Lukija da li si dobro podeiso P95 i OCCT ? Nesto mi nije jsano kako to ne radi a svima radi.
 
P95 je potreban ali ne i dovoljan uslov stabilnosti.
 
Ovo sa Blender-om je opste poznato ima vec nekoliko godina kako youtube revieweri, overclock-eri i ljudi iz industrije govore kako je p95 nedevoljan, i kako ne postoji ni jedan sinteticki test koji moze da emulira blender stabilnost, samo specijalna scena u blenderu to moze.

Isto vazi i za furmark, svi su presli na loop-ovane scene iz 3dmark (extreme)
 
Npravio sam script koji beskonacno vrti 6 scena iz Blender benchmarka pa da vidimo.
 
Neka tvoja, necija scena koja nije benchmark moze jos bolje da radi, ne secam se tacno, ako mozes da proveris nadjes sta koristi neko od youtubera, neko je imao custom scene, mogla je i da se skine, HardwareUnboxed najverovatnije, mozda HardwareCanucks, mozda GamersNexus.

Doduse nisam ulazio u detalje, to sto vrtis moze da bude dovoljno.
 
Scene su one koje dolaze uz benchmark. Ako se ne varam GN ima neki svoj GN Monkey Heads scene ali mislim da nije za download.
 
Evo mene opet sa nekim svojim rezultatima i "zapažanjima". Igrao sam se sa procesorom kada sam imao vremena, malo se dopisivao sa @Lukija , i ovo su rezultati na kojima sam stao za sada. Kako stvari stoje, mislim da ću se vratiti na varijantu sa slike broj 3, a ukratko ću ispričati i zašto.

Rezultat sa slike 1. je sa default podešavanjima koje sam već kačio ovde. Kada sam krenuo da se igram sa Curve Optimizer-om, došao sam do nekog skoka u performansama od 3%, što je na neki način jako malo, ali je po meni super jer je "besplatno", tj temperatura procesora ne skače uopšte - to je slika 2. Pokuša sam da idem ispod podešavanja -12 za sva jezgra, ali mi se windows činio nestabilnim, nisam imao BSOD-ove, ali nisam imao vremena da to guram niže i da dodatno eksperimentišem jer kompjuter koristim aktivno za posao. Da kažem informativno da sam sa -15 dobio još nekih 50 poena u CB23.

Pošto sam video da većina softvera koje koristim udara u TDC limit, to je prva stvar koju sam povećao nakon podešavanja Curve Optimizer-a. Tu sam dobio dodavanjem za 10A na početnih 95A dobio još nekih 3%, za ukupnih 6% - slika 3, Jako bitno da napomenem bez povećavanja temperatura u celom sistemu, što opet smatram 6% "besplatnih" dobitaka u performansama. Daljim povećavanjem TDC-a ništa nisam dobijao zbog drugih udaranja u druge limite.

Onda sam krenuo da povećavam sve po malo, da vidim da dođem do ukupnog skoka od 10%, ali je onda došlo do povećanja temperatura u celom sistemu - slika 4. Nekome nije puno 80 stepeni za procesor, ali uzimajući u obzir to da se dešava da paralelno radim CPU render u Arnoldu, i GPU render u Blenderu, dolazi do podizanja temperature zbog RTX 3080 koja emituje dosta toplote u celom sistemu, gde procesor ide do 85 stepeni, što je za moj ukus možda malo previše.

Procesor ovako bustuje na sva jezgra između 4175 i 4200, u većini workload-ova koje ja koristim. Sve je stabilno, izvrteo sam sve testove koji su mi pali pod ruke, Prime95, Aida, Blender, itd i sve je rock solid. Uglavnom, dosta mi je veliki skok od 5 stepeni za dodatnih 3 i kusur posto performansi. Nekako su mi slađi ovi "besplatni", možda ću opet pokušavati da se igram malo sa Curve Optimizerom da vidim dokle može da ide dok ne padne BSOD ili WHEA.
 

Prilozi

  • oc-progress.jpg
    oc-progress.jpg
    158 KB · Pregleda: 51
Plot twist. Ono sto pise u event logu ne znaci ta je u pitanju 12to jezgro. CPU-Z to the rescue. Evo sta kaze CPU-Z report:


Kod:
APICs
-------------------------------------------------------------------------

Socket 0 
    -- Node 0 
        -- CCX 0     
            -- Core 0 (ID 0) 
                -- Thread 0    0
                -- Thread 1    1
            -- Core 1 (ID 1) 
                -- Thread 2    2
                -- Thread 3    3
            -- Core 2 (ID 2) 
                -- Thread 4    4
                -- Thread 5    5
            -- Core 3 (ID 3) 
                -- Thread 6    6
                -- Thread 7    7
            -- Core 4 (ID 4) 
                -- Thread 8    8
                -- Thread 9    9
            -- Core 5 (ID 5) 
                -- Thread 10    10
                -- Thread 11    11
        -- CCX 1     
            -- Core 6 (ID 8) 
                -- Thread 12    16
                -- Thread 13    17
            -- Core 7 (ID 9) 
                -- Thread 14    18
                -- Thread 15    19
            -- Core 8 (ID 10) 
                -- Thread 16    20
                -- Thread 17    21
            -- Core 9 (ID 11) 
                -- Thread 18    22
                -- Thread 19    23
            -- Core 10 (ID 12) 
                -- Thread 20    24
                -- Thread 21    25
            -- Core 11 (ID 13) 
                -- Thread 22    26
                -- Thread 23    27

U prevodu, problematicno je jedanesto jezgro (Core 10, APIC 24 i 25).
 
Neki programi počinju da broje jezgra od nule a neki od 1.
 
Nije to problem. Windows kaže APIC 25. A procesor ima 24 threada. Kao što vidiš, APIC id 25 je Core 10 (jedanaesto jezgro, drugi thread). APIC 26 i 27 su Core 11 (dvanaesto jezgro) . Imam utisak da su APIC ID dodeljeni full verziji kao što je 5950X i zato 5900X ima "rupe" tamo gde su nepostojeća jezgra.

Edit: Biće da sam u pravu. Evo kako to ide za 5950X:

Kod:
APICs
-------------------------------------------------------------------------

Socket 0   
    -- Node 0   
        -- CCX 0       
            -- Core 0 (ID 0)   
                -- Thread 0    0
                -- Thread 1    1
            -- Core 1 (ID 1)   
                -- Thread 2    2
                -- Thread 3    3
            -- Core 2 (ID 2)   
                -- Thread 4    4
                -- Thread 5    5
            -- Core 3 (ID 3)   
                -- Thread 6    6
                -- Thread 7    7
            -- Core 4 (ID 4)   
                -- Thread 8    8
                -- Thread 9    9
            -- Core 5 (ID 5)   
                -- Thread 10    10
                -- Thread 11    11
            -- Core 6 (ID 6)   
                -- Thread 12    12
                -- Thread 13    13
            -- Core 7 (ID 7)   
                -- Thread 14    14
                -- Thread 15    15
        -- CCX 1       
            -- Core 8 (ID 8)   
                -- Thread 16    16
                -- Thread 17    17
            -- Core 9 (ID 9)   
                -- Thread 18    18
                -- Thread 19    19
            -- Core 10 (ID 10)   
                -- Thread 20    20
                -- Thread 21    21
            -- Core 11 (ID 11)   
                -- Thread 22    22
                -- Thread 23    23
            -- Core 12 (ID 12)   
                -- Thread 24    24
                -- Thread 25    25
            -- Core 13 (ID 13)   
                -- Thread 26    26
                -- Thread 27    27
            -- Core 14 (ID 14)   
                -- Thread 28    28
                -- Thread 29    29
            -- Core 15 (ID 15)   
                -- Thread 30    30
                -- Thread 31    31
 
Poslednja izmena:
Update. CPU je preziveo 24h neprekidne torture Blenderom. Ispostavilo se da je Core 10 (11-to jezgro) malo kilavo pa ne voli underclock. Podesio sam CO per core tako sto sam sva jezgra setovao na -15 osim Core 10 koje je na -5.
 
Mene je y-cruncher oborio, iako je OC prolazio P95, RealBench 8+h. CO pomeren sa -30 na -25 za par jezgara i sve se cini OK. CB23 pao za ~50 poena Multicore.
 
Update. CPU je preziveo 24h neprekidne torture Blenderom. Ispostavilo se da je Core 10 (11-to jezgro) malo kilavo pa ne voli underclock. Podesio sam CO per core tako sto sam sva jezgra setovao na -15 osim Core 10 koje je na -5.
Da se ispravim. Treba da stoji undervolt. Malo sam posmatrao uticaj ove promene i imam utisak da MC performanse zavise od toga koliko je najslabije jezgro jako. Probe radi, probao sam CO -5 all core i dobio sam skoro iste rezultate kao i sa -15 all i -5 Core10. Kada je u pitanju single core, tu je sve ocekivano. Svako jezgro boostuje shodno koliko je magnitude setovan.
 
Jel ima neko neki predlog za "low stress" test stabilnosti, gde se dostize neki maksimalni boost clock 4850MHz umesto 4.5-4.7 GHz allcore? Ovo je cisto akademski, znam koja su mi stabilna podesavanja, ali mi se desilo da na -30 CO all core i +200MHz prolazim P95 i neke druge stress testove "teske kategorije" a pucam na podizanju Windowsa i Google Chrome...

Probao sam RealBench Image Editing Benchmark na Loop, OCCT Core cycler i 3DMark physx test ali ne rusi sistem kao sto sam mislio da ce. Ispada da je najbolje namestiti automatski restart sistema preko noci, da reboot loop otkrije takve nestabilnosti.
 
Poslednja izmena:
Probaj CoreCycler:


Jako interesantan alat. Moze da se podesava u sitna crevca. Podrazumevano je da koristi P95 i SSE tako da je to upravo ono sto ti treba.
 
To je to :) Dvaput uzastopce WHEA Core 0 reboot par sekundi nakon pocetka testa, tacno kako sam ocekivao. Ostale alate ocigledno nisam znao podesiti kad su prolazili test stabilnosti :ROFLMAO:
 
@Lukija odlican test!!! Dva najbolja jezgra su mi bila nestabilna, a na svim ostalim testovima (programima za testiranje) nikada nije pokazao nestabilnost. Promenio CO na per core i stavio ta dva jezgra na -15, ostatak i dalje na -30. Sada, nakon 6 iteracija nema gresaka.
 
Pazi, autor CoreCycler je napomenuo da ako hoces ekvivalent "12h Prime95" stabilnosti moras ostaviti test da radi 12h x broj jezgara... meni je na 69 iteraciji puklo jezgro (nice)
 
@danilo989 hvala za informaciju. No, 12h x 16 = 192h = 8 dana ! :D

Ja sam modifikovao skriptu da bih mogao da "gadjam" jezgra koja zelim da ne cekam da dodju na red. Pusticu preko noci da radi 12h, to je 1h po jezgru. 8 Dana zaista ne mogu.
 
^ mipko, može li modifikovana skripta na pm? Hvala unapred!
 
Moze i ovde. Ove 2 skripte umesto originalnih ce vrteti jezgra koja stavite kao parametar za poziv. Treba da doradim skriptu da kada se ne stavi nikakav parametar da se ponasa kao i pre.
Kada otvorite bat fajl, videcete da sam ja vrteo na jezgrima 2 i 3 - koja su kod mene bila problematicna. Odnosno, kao najbolja jezgra boostovala su kao luda, ali su "ispadala" kod zaokruzivanja.
 

Prilozi

  • corecycler_cpu.zip
    31.5 KB · Pregleda: 4
Interesantan je CoreCycler. Ispada da su ona jezgra koja su markirana kao najbolja u stvari najmanje raspolozena za undervolt. Posto najvise boostuju, verovatno nema vise mesta za manevrisanje. Morao sam da ih stavim na -5 (Core 2 i Core 3) dok sam Core 6 stavio na -10. Ostala su na -15. Za sada prolazi 14h ili 12 iteracija.
 
CC je definitivno najkorisniji alat za sada. Prime95 1.5h je sala komika.
Ja sam prosao nesto bolje od Lukije (za sada). Takodje su 2 najbolja jezgra prosla lose. Sada imam -30 na svim jezgrima osim na 2 najbolja. Jedno je moralo na -25, drugo na -15.
CC cu pustiti da radi preko vikenda 48h. Sada je prosao samo tri iteracije. No, neki drugi pokazatelji koji su ukazivali na nestabilnost su nestali.
 
No, neki drugi pokazatelji koji su ukazivali na nestabilnost su nestali.
Na primer? Pitam jer imam problem da nasumice sve zasecka na sekund, kao slowmo. Gledao Event Viewer, LatencyMon ali nista ne ukazuje na odredjenog krivca. Deinstalirao Realtek LAN drajver i za sad na MSovom drajveru izgleda nema problema, ali i dalje je moguce da je do nestabilnog OCa.
 
Vrh Dno