Šta je novo?

Nove vesti o Penryn-u...

Khm... :eyebrows:
Prvo, zaboravljas chipset i strapove u celoj prici. Veci FSB == relaksirani tajminzi za memorijski kontroler zar ne? Da ne pominjem razlicite memorijske kontrolere.
Pa i da je to tako, to ce uticati 1-2% na performanse.

Drugo, sam Penryn ako radi na 2666 MHz njemu tajminzi nisu nista ostriji u odnosu na C2D na istoj frekvenciji bez obzira na FSB. Jedan CPU takt traje 1 / 2,666,000,000 Hz u oba slucaja.
Da ali mu FSB radi na 1333 Mhz, sto je u komunikaciji mem.ctrl->CPU oko 2 ciklusa u idealnim uslovima, a kod Core 2 je to 2.5 ciklusa. Prema tome, latency je ostriji, a i tajminzi. Generalno Penryn je tu u prednosti, visi FSB, manji CPU multipikator, ostriji tajminzi, veci kesh... jel dosta ? :d
Ili opet hoces da se uhvatis za pricu o memorijskim tajminzima koji itekako umeju da budu "saturisani" core prefetcherom, memorijskim kontrolerom i ko zna cime jos.
Ja se ne bih usudio da to zakljucim tako brzopleto pogotovo imajuci u vidu shuffle i radix16 divider.
Ne zakljucujem nista, samo mislim da je nerealno ocekivati cudo. Mozda ce se to negde i videti, a negde i nece. Osim toga, ja nisam od onih koji koriste komp za SPi. Ako mi bas treba racunanje PI broja na mnogo decimala Wolframova Mathematica ima daleko bolje funkcije za to.
 
Poslednja izmena:
To sam rekao jer su dva XIP-a to potvrdila,dinos je jedan od njih(btw ja mislim da je to nas covek iz Australije:),ili je bar poreklom sa Balkana,pa mozes da mu posaljes PM tamo na XS da ti potvrdi :) )

Nema sta da mi oni potvrdjuju kad nemaju pojma. Jesu li oni testirali i objavili neke rezultate? Koliko ja vidim jos nisu.

Prvo, apsolvirajmo cinjenicu da dinamicki overclock ne postoji u desktop chipu barem ako je verovati Intelovim zvanicnim podacima sa sajta.

Drugo, razmisljajmo logicno:

1. Ljudi su sve ostalo testirali na 2666 MHz
2. Objavili su i rezultate gde je Wolfdale losiji od Core 2

Iz 1 i 2 sledi da nisu imali nameru da laziraju rezultate jer bi inace:

1. Testirali sve na vecem taktu i ne bi pokazali na kom
2. Objavili samo dobre rezultate

Znaci ako nisu hteli da laziraju, zasto bi stelovali samo jedan od rezultata i to samo SuperPI za koji je manje verovatno da ce raditi brze od bilo kog testa u novom Everestu?

Ja verujem da je taj SuperPI rezultat na 2666 MHz kao i ostali, a vi kako hocete. Mislim da to nije nemoguce.

Da ali mu FSB radi na 1333 Mhz, sto je u komunikaciji mem.ctrl->CPU oko 2 ciklusa u idealnim uslovima, a kod Core 2 je to 2.5 ciklusa.

Objasni o kojim ciklusima pricas? Ciklusima CPU-a, FSB-a ili memorije? Kako si do njih dosao?

Ne zakljucujem nista

Pa napisao si da imaju skoro isti IPC sto je nemoguce vec ako se uzme u obzir 1 clock shuffle i radix16 divider. Kako onda sad kazes da ne zakljucujes nista? :trust:
 
Poslednja izmena:
Objasni o kojim ciklusima pricas? Ciklusima CPU-a, FSB-a ili memorije? Kako si do njih dosao?
Pa valjda si mogao implicitno da zakljucis. Ako vec moram da ti nacrtam, onda CPU koji radi na 2666 Mhz pristupa FSB-u koji radi na 1333 Mhz svaka dva procesorska ciklusa. Jedan pristupi, a jedan ceka.

Pa napisao si da imaju skoro isti IPC sto je nemoguce vec ako se uzme u obzir 1 clock shuffle i radix16 divider. Kako onda sad kazes da ne zakljucujes nista? :trust:
Audio, opet *****avash ! :d U aplikacijama u kojima se intenzivno koristi FDIV, ce radix16 verovatno doneti ubrzanje. Al to ne mozes da zakljucis dok ne probas. Moguce da je SPi brzi zbog toga, to sam na pocetku i rekao, ako nisi primetio.
 
Pa valjda si mogao implicitno da zakljucis. Ako vec moram da ti nacrtam, onda CPU koji radi na 2666 Mhz pristupa FSB-u koji radi na 1333 Mhz svaka dva procesorska ciklusa. Jedan pristupi, a jedan ceka.

U jee... Opasan si Fedja... :-devil-:

Prvo, chipset FSB radi na 333MHz jer je Quad-Pumped -- samo data rate je 1333MHz.
Drugo, CPU FSB takodje radi na 333MHz -- samo jezgro i L2 rade na 2666MHz.

Znaci ako je:

1 / 333MHz = 3ns

I ako je:

1 / 2666MHz = 375µs

Onda je:

3ns / 375µs = 8 CPU taktova za jedan FSB takt.

E sad, ako to podelis sa 4 dobices ta 2 takta o kojima pricas, ali command i data rate nije isti. Cela racunica se jos vise komplikuje kad se uracunaju tajminzi memorije i njena radna frekvencija, kao i efikasnost L2 kesa i utilizacija bus-a od strane drugih bus agenata. :p

Moguce da je SPi brzi zbog toga, to sam na pocetku i rekao, ako nisi primetio.

Nisam, zato i *****avam. Gde si to rekao? :d
 
Eh sad,ljudi koji su pod NDA ili su videli cip nemaju pojma,a mi koji smo videli lepe slicice na netu smo u pravu :p .
Ali rekoh,daj da sacekamo neki oficijalni test,tipa LostCircuits ili slicno pa da vidimo sta se desava.
 
U jee... Opasan si Fedja... :-devil-:
E sad, ako to podelis sa 4 dobices ta 2 takta o kojima pricas, ali command i data rate nije isti. Cela racunica se jos vise komplikuje kad se uracunaju tajminzi memorije i njena radna frekvencija, kao i efikasnost L2 kesa i utilizacija bus-a od strane drugih bus agenata. :p
Apsolutno. Nisam ni rekao da je sve 100% crno na belo, ali u odnosu na C2D Penryn moze da ima samo manji memory latency, a ti sad mozes da se natezes sa mnom koliko hoces! :d
 
Eh sad,ljudi koji su pod NDA ili su videli cip nemaju pojma,a mi koji smo videli lepe slicice na netu smo u pravu :p .

Ja sam rekao da nemaju pojma ako tvrde da je SuperPI rezultat delo dinamickog overclockinga. Obrazlozio sam (nadam se dovoljno) logicno i zasto tako mislim.

Sto se tice NDA, mogu i ja sutra da ga potpisem ali sta mi vredi ako nikom ne smem nista da kazem? Mogu da vas ubedjujem da ja bolje znam do sutra i da vam kazem da sam potpisao NDA i video/koristim cip ali sta je sve to bez dokaza?

Da li je neko video njihov NDA? Da li su mozda okacili skeniran NDA kao PDF za download da im overimo credentials?

Moja poenta je da ako ne verujes ljudima sa screenshotima koji ne fermaju NDA, zasto bi verovao onima koji su potencijalno angazovani da sire dezinformacije bilo od strane konkurencije bilo od strane samog Intela?

Poenta je takodje da mnogi ljudi grade online kredibilitet ne bi li ga u nekom trenutku "potrosili" na nesto sto ce im doneti materijalnu korist.

Inace slazem se da treba sacekati jos testova ali i dalje mislim da je taj SuperPI realan za 2.66GHz Penryn @ stock speed.

@drfedja:
Zaboravljas da povecanje L2 sa sobom obicno donosi povecanje njegove latencije. Zbog toga nije iskljuceno da je efektivna latencija pristupa memoriji nesto veca bez obzira na FSB i ostale parametre sto se moze manifestovati u pojedinim testovima koji su osetljivi na latenciju L2.
 
Ja sam rekao da nemaju pojma ako tvrde da je SuperPI rezultat delo dinamickog overclockinga. Obrazlozio sam (nadam se dovoljno) logicno i zasto tako mislim.
Mislim da je lik iz Ozzland-a samo rekao da je to OC rezultat,a ne da je postignut sa dyn. OCom koji ce imati mobilna verzija cipa.
Vecina tih likova se bavi nekom vrstom preprodaje na tom forumu.Sto se tice NDA,sam NDA bi ih obavezao da ne smeju da ga stampaju,kopiraju i/ili pokazuju javno drugima na uvid :d,tako da je nemoguce dobiti dokaz,osim ako ne poznajes nekog licno :).
 
Poslednja izmena:
@drfedja:
Zaboravljas da povecanje L2 sa sobom obicno donosi povecanje njegove latencije. Zbog toga nije iskljuceno da je efektivna latencija pristupa memoriji nesto veca bez obzira na FSB i ostale parametre sto se moze manifestovati u pojedinim testovima koji su osetljivi na latenciju L2.
To uopste ne mora da bude slucaj. Pre ce biti da brzi FSB donosi smanjenje latencije nego sto veci L2 donosi povecanje. No dobro, kako ti kazes! :d
 
Mislim da je lik iz Ozzland-a samo rekao da je to OC rezultat

Ja samo kazem da taj lik nije svojerucno pustio screenshot CPU-Z i SuperPi rezultata koji je slican ovome i na taj nacin dokazao svoju tvrdnju. I opet kazem, vi mu verujte ako hocete ali ja za sada necu.

drfedja je napisao(la):
To uopste ne mora da bude slucaj.

Seti se Prescott (1MB i 2MB) L2 i starog P4 L2.
 
Evo recimo moj Opteron sa 2x1MB L2 nema uopste sporiji L2 od Manchester-a sa 2x512K L2, cak stavise, brzi je od Brisbane-ovog 2x512K L2.
Intel Northwood nema sporiji L2 od Willamette-ovog. Tualatin sa 512K L2, nema sporiji L2 od Tualatina sa 256K. Itd...
 
Ja samo kazem da taj lik nije svojerucno pustio screenshot CPU-Z i SuperPi rezultata koji je slican ovome i na taj nacin dokazao svoju tvrdnju. I opet kazem, vi mu verujte ako hocete ali ja za sada necu.



Seti se Prescott (1MB i 2MB) L2 i starog P4 L2.

Ako misliš na Prescott vs Irwindale ubrzanje je bilo skoro nikakvo zato što je keš udvostručen a nije povećana asocijativnost > otud i povećanje latencije. Penryn ima povećanu asocijativnost u odnosu na sadašnje procesore tako da tu ne bi trebalo da bude ikakvih problema.
 
Poslednja izmena:
Povecanje asocijativnosti ne znaci da kes ima manju latenciju. Cak stavise, moze da znaci i suprotno. Kes koji ima manji set asocijatovnosti obicno ima i nesto krace vreme pretrazivanja, ali ima bolji "hit rate".
Povecanje latencije kod veceg L2 je obicno zbog toga sto je lakse, jeftinije i jednostavnije napraviti sporiji L2, a da yield bude na pristojnom nivou, a ponekad veci L2 moze da donese vise nego sto se izgubi povecanom latencijom.
 
Current Core 2 Duo and Core 2 Quad processors have 16-way associativity, but on Penryn this number has been increased to 24-way associativity, which improves the access paths to the larger L2 cache.

http://www.legitreviews.com/article/488/1/

Malo sam ukrivo shvatio, ali poenta je valjda tu? :)
 
Poenta je u tome da sa povecanim set associativity-jem se povecava postotak pogotka trazenog podatka u keshu, t.j. memorijske adrese koja je kopirana u kesh. Tako recimo, citav fizicki adresni prostor ce se efikasnije kesirati ukoliko je kes ima bolju asocijativnost. Kada procesor izda trazenu memorijsku adresu, komparator poredi trazenu memorijsku adresu sa onom za koju je "tag" oznacio kao validnu u keshu. Ukoliko se trazena adresa poklapa sa tagovima u odredjenom segmentu kesha, onda se pretrazuje taj deo kesha gde je podatak. E sad ovo je dobro s' obzirom na to da se iz memorije podaci ne ucitavaju samo sa jednog mesta u procesorske registre, nego sa nekoliko, tako na primer za stack operacije koje se obavljaju ucestalo pri svakom rekurzivnom pozivu, adekvatno kesiranje, moze da pomogne. Pored toga streaming npr. nekog multimedijalnog sadrzaja iz heap segmenta se moze istovremeno kesirati sa simultanim izvrsavanjem nekog koda koji se iscitava iz potpuno druge memorijske lokacije. Takodje, velika asocijativnost moze pomoci kod multitaskinga jer tada razlicite vrste podataka i instrukcija ne "istiskuju" jedni drugie i procesor u keshu skoro uvek ima ono sto mu treba. Primera radi L3 na Barceloni ce biti 32-way set associative.
U sustini dodatna asocijativnost povecava latency utoliko sto je potrebnan ciklus vremena za komparaciju.
 
Potpuno se slazem sa tom konstatacijom. ;)
 
Nije nikakvo čudo s obzirom da će kasnije ići i na FSB1600.
 
@audiofreak

Evo naleteo sam na topic na XS-u:
http://www.xtremesystems.org/forums/showthread.php?t=151920 (56K warning)
Kazu za SPi:
Just over a second and a half faster than conroe clock for clock
12MB L2(6 po jezgru),radix-16,veci FSB,itd. daje nekih ~10% bolji skor za SPi.
U ostalim testovima je oko 5% brzi od Conroe-a sa 4MB L2 kesa.

Znaci onaj "super rezultat" je bio debelo OCovan Yorkfield.Ne def. clock.
 
Pa otvori taj link u mom postu...
 
Nazad
Vrh Dno