Ajde, u igri ili na vebu je teže uočiti problem, ali u renderu će biti jasno ako negde nešto pođe po zlu. I ti algoritimi nisu ništa drugo nego gomila proračuna.
Pa i ne mora da bude tako jasno. Negde će neki piksel možda dobiti pogrešnu boju i sl. To ćeš teško uočiti.
I nije primećeno na Windows-u, gde Win 10 (pošto pretpostavljam da većina Ryzen korisnika vozi desetku) ima 10-15 puta više korisnika nego sve linux distribucije.
Potvrđeno je i na Windows-u. Zato je lik koji je primetio problem na Windows-u kreirao kill-ryzen-win skriptu. Ova skripta teže i sa manjom učestanošću izaziva pucanje, u odnosu na Linux skriptu, ali kod očajnih primeraka procesora, veoma brzo puca.
S druge strane, ako ne primetiš (takav) bug, da li to znači da on ne postoji? Tj. da li je možda moguće da Coffee Lake ima bug koji je teško uhvatiti a može da dovede do lošeg rezultata simulacije koja traje danima ili nedeljama? Prvo, za takve poslove se nikad ne kupuje nova platforma. Evo, npr. jedan Skylake bug je primećen skoro dve godine od izlaska te arhitekture. Dalje, da ne govoroimo o ECC memoriji.
To se slaže sa onim što sam pomenuo da ni "ispravni" procesori nisu savršeni. U ostalom zato postoje serverske verzije procesora, ECC memorije, radiation hardened procesori i ostale ekstremne metode za povećanje stabilnosti. Ali čak ni potrošačke verzije procesora ne bi smele da budu toliko nekvalitetne da u roku od 30 minuta možeš da izazoveš segfault i to na nasumičnom mestu i u nasumično vreme. Ako to postane standard, onda smo nagrabusili. U normalnu prodaju će se puštati neispravni procesori a ispravni će se prodavati kao premium primerci po mnogo većoj ceni.
Ja nisam programer pa ne kompajliram često programe ali dobra doza kompajliranja na Linux-u se dešava u pozadini. Npr. na Ubuntu-u, nVidia i VirtualBox kernel moduli se kroz DKMS kompajliraju pri update-u kernela. Sve što mi treba je da kompajliranje pukne (mnogo bolji ishod) ili da napravi grešku negde u generisanju opcode-a pa da mi crkavaju moduli u radu i da ne mogu da skapiram zbog čega (mnogo gori ishod).
Ali kada radiš neki proračun, imaćeš gomilu različitih testova i uporedićeš rezultate. I ako primetiš da jedan ima neočekivanu vrednost, ponovićeš taj test.
Nije to baš tako jednostavno. Proračuni koje sam pominjao su takvog tipa da ne znaš kakve rezultate treba da očekuješ. Zato i radiš proračune. U pitanju je simulacija kompleksnih molekula gde se proverava stabilnost molekula, hemijske osobine itd. Ne znaš šta da očekuješ unapred a postoji i određena doza nedeterminizma. Dva proračuna neće dati apsolutno identičan rezultat. Najgore što može da ti se dogodi u tom slučaju je da te rezultati navedu na pogrešne zaključke a to može da te košta i naučnog rada.
A na temi "kako reprodukovati bug", evo jednog zanimljivog odgovora
To je bio onaj Phoronix-ov stress test koji 100% puca na istom mestu na svim platformama. Ovi segfault-ovi na Ryzen-u su mnogo podliji i na random mestima se javljaju. Majkl sa Phoronix-a se tada bio malo ispr**eravao, da izvinete na izrazu.
Hteo bih još da napomenem da postoji velika razlika između HT bug-a kod Intel-a, i segfault problema kod Ryzen-a. Intel je problem popravio u mikrokodu što znači da je problem bio u mikrokodu ili je problem determinističke prirode i može da se napravi workaround u mikrokodu. Ryzen problem po svemu sudeći ne može da se ispravi u mikrokodu jer je vezan za kvalitet izrade procesora i totalno random. Nekvalitetni primerci jednostavno imaju neki crosstalk ili curenje struje ili flipovanje bita usred temperaturnih oscilacija ili nešto peto što ne može da se popravi mikrokodom. Znači yeald uopšte nije toliko dobar koliko AMD priča nego turaju i "malo" falične procesore na tržište nadajući se da to neće izazvati odmazdu.
Evo sad čitam kukanje u vezi pucanja Overwatch-a i da Blizzard navodno radi sa AMD-om na rešavanju problema. Ne bi se iznenadio da problem uopšte nije u Radeon-ima i/ili drajverima kako svi misle nego u Ryzen-u.
Da ne bude zabune. Ja nisam nikakav Intel zagovornik. Svi moji dosadašnji procesori su bili AMD osim Pentium keca na 133 Mhz i nekog i5 u laptopu. Boli me to što i posle skoro godinu dana od kada je Ryzen izašao, od AMD-a možeš da dobiješ samo mačku u džaku.