Šta je novo?

Nove vesti o Penryn-u...

Naravno da nece biti samo serverska linija ;)

'oces da kazes da su oi tvoji pogresili u projekciji koju su napravili po pitanju tipova i kolicina desktop procesora za Q3 i Q4 ove godine?

shares.jpg

;)
 
Poslednja izmena:
'oces da kazes da su oi tvoji pogresili u projekciji koju su napravili po pitanju tipova i kolicina desktop procesora za Q3 i Q4 ove godine?



Izgleda da ce trebati mnogoooo vise :) , Nedjo ako su to moji onda su tvoji zeleni, jel tako? :) (ma sve je to nase)
 
'oces da kazes da su oi tvoji pogresili u projekciji koju su napravili po pitanju tipova i kolicina desktop procesora za Q3 i Q4 ove godine?



Izgleda da ce trebati mnogoooo vise :) , Nedjo ako su to moji onda su tvoji zeleni, jel tako? :) (ma sve je to nase)

Naravno da je nase... sve! ;)

LM, evo jedne vesti koja ce obradovati frika audija:

http://arstechnica.com/news.ars/post/20070605-intel-updates-compilers-for-multicore-era.html

P.S
ideupark, jel vidis da ja na forumu ne pisem samo o novostima iz "zelenog" tabora ;)
 
Poslednja izmena:
Nisam bas razumeo grafikon, ali zato sam procitao ovo:
http://www.fabtech.org/content/view/2789/73/

Ukratko, Intel je od ATMI-ja narucio prve kolicine CMP slurry-ja za high volume proizvodnju u 45nm jos pocetkom maja tako da kada se sve uzme u obzir, moze se ocekivati product launch krajem Q3/2007.

Sto se tice linka koji si dao, ja Intel C++ Compiler 10.0.025 koristim odavno i mogu ti reci da generise i SSE4 optimizovan kod za Penryn/Wolfdale.

Uzgred, kontakti iz Intela mi kazu da Microsoftov kompajler u novom Visual Studio paketu koji je trenutno u beta fazi takodje podrzava SSE4. Naravno nivo optimizacije je sigurno slabiji nego kod Intela ali cak i mogucnost da se koriste nove instrukcije u inline asm blokovima ili preko intrinsic-a su znacajna stvar.

U razgovoru sa njihovim multi-core managerom dao sam im par ideja kako da jos bolje promovisu SSE4 kod developera i kod kupaca. Sve u svemu, ovaj put cemo najverovatnije znacajno brze videti SSE4 capable softver i zelecemo da kupimo Wolfdale zbog njega.
 
Samo jos da developeri "vektorizuju" svoj kod i da koriste odgovarajuce algoritamske strukture i bice ql.
 
mucno je to, bolje da se naprave standardne biblioteke za sve i svasta koje su vec vektorizovane pa njih da koristimo umesto sami da se patimo, i ovako pa je problematicno...
a uvek postoji i druga strana price,
nije fora da se kvalitetan program prodaje za male pare nego nekvalitetan za velike...
 
Hehe, pa da, programerska logika ti je to ! :d Ne uzimamo mi pare na programu, nego na odrzavanju istog ! LOL
Sto se tice vektorizacije, ***, ne mozes bas sve vektorizovati. Ja verujem da su Borland, Intel, GCC i mnogi drugi u sebi vec imaju standardne biblioteke koje su vektorizovane. Medjutim nekada moras nesto i sam da napises, pa onda ako vodis racuna kako je to uradjeno i imas nesto znanja o tome sta "vole" SIMD arhitekture, onda ces sigurno praviti softver u skladu sa tim. Medjutim, cak i jedan Adobe ne vodi racuna o performansama u svom softveru, pa tako npr. u Acrobatu za pretragu teksta koristi 3vijalan linear search algoritam za pretragu teksta iako recimo kojekakvi third party pdf readeri koriste bsearch koji je primetno brzi. Slobodno mogu da kazem da me to smara kada pretrazujem neku knjizurinu od 1000 strana. Sasvim je sve jedno koji imas procesor i koji SIMD ako je algoritam boolja! :d
 
Poslednja izmena:
Sto se tice vektorizacije, ***, ne mozes bas sve vektorizovati.
Ali ono sto moze jede dosta vremena i moze se x puta ubrzati. Sto je najbolje, safe je sasvim.

Ja verujem da su Borland, Intel, GCC i mnogi drugi u sebi vec imaju standardne biblioteke koje su vektorizovane.
Intel ima odredjene. Prodaje ih zasebno. Tipa Math lib i Crypto lib.
Borland nije imao u C++ Builderu (a to je u sustini isti lib base), znam jer smo mnoge stvari extremno optimizovali.
GCC - no clue :D
 
mogu oni da cepaju jezgra koliko hoce po procesoru, ali kako je stanje sa software-om, meni zauzece ne prelazi 50% , da imam quad core bilo bi max 25-30% tako da dzabe za sad...(dzaba sam ga i kupovao )
 
Cak je i malo sporiji Wolfdale na istom taktu(bar u Everestu ..) od C2D e6700.Treba sacekati i druge testove osim Everesta.
 
Poslednja izmena:
Radjeno na ASUS P5K, mozda nije adekvatan BIOS.
Intel je svoje rezultate dao na ploci koja sigurno radi, a nigde nije bio sporiji Penryn od C2D na istom taktu.
 
Pa Intel ce uvek da da povoljnije rezultate. P5K sasvim lepo podrzava Penryna, bar sto se tice Chipseta. Osim toga, Penryn je radio sa ostrijim setovanjima od C2Q i na vecem FSB-u. Sasvim sigurno nije ni izbliza tolika razlika zato sto su dodali jos 2 MB na postojecih 4 MB L2 po jezgru.
 
Poslednja izmena:
Ocigledno da tih dodatnih 2MB pomaze toliko.Mada treba sacekati pravi test ovih procesora.Ovo je kao neki sneak peak :).
 
P5K sasvim lepo podrzava Penryna, bar sto se tice Chipseta.
Podrzava i moja ploca quad core Xeone, ali mora update BIOS-a da bi radili uopste. Toliko o tome.

Osim toga, Penryn je radio sa ostrijim setovanjima od C2Q i na vecem FSB-u.
Uporedjenje sa C2Q nije problem, vec poredjenje sa C2D (E6700), posto je i od njega sporiji u nekim testovima. Jeste veci FSB, ali i vece memory latencije nego C2D.
 
Ocigledno da tih dodatnih 2MB pomaze toliko.Mada treba sacekati pravi test ovih procesora.Ovo je kao neki sneak peak :).
Pa ajmo realni da budemo. Koliko pomaze Conroe-u 4MB vs 2MB kod Allendale-a ? Pa, malo.
Ajd neka isto toliko pomaze Penrynu, s' obzirom da mu je povecana i asocijativnost.

Alfaunits je napisao(la):
Podrzava i moja ploca quad core Xeone, ali mora update BIOS-a da bi radili uopste. Toliko o tome.
Drugo je serverska ploca. Proizvodjac iz predostroznosti ne dozvoljava da radi bilo koji drugi CPU koji nije predvidjen trenutnim BIOS-om.
Alfaunits je napisao(la):
Uporedjenje sa C2Q nije problem, vec poredjenje sa C2D (E6700), posto je i od njega sporiji u nekim testovima. Jeste veci FSB, ali i vece memory latencije nego C2D.
Sorry, ja sam prevideo, ali tamo se lepo u everestu da je u pitanju dual core penryn :d Ok, onda ga poredimo sa C2D E6700.
Nego, gde si ti to video veci latency na penrynu ? Penryn u testu ima i veci fsb i manje latencije od referentnog C2D E6700.
 
Poslednja izmena:
Pa ajmo realni da budemo. Koliko pomaze Conroe-u 4MB vs 2MB kod Allendale-a ? Pa, malo.
Ajd neka isto toliko pomaze Penrynu, s' obzirom da mu je povecana i asocijativnost.

Verovatno me nisi razumeo,mislio sam da mu ne pomaze skoro uopste :).Ali rekoh,ajde da sacekamo malo opsirniji test,secam se onog slajda sa IDF-a,mislim da je HL2 bio,i onih navodnih 25% povecanja za frame rate :) ,Penryn vs Conroe.Deluje nerealno,ali da im damo benefit of a doubt :d
 
Inace bolji SPi rezultat moze da bude i posledica Intelovog dinamickog overklokinga pojedinacnih jezgara u single thread workload-ima. Prema tome, ako je Penryn na 2.66 dao 14 sec spi 1M, to lako moze da bude rezultat na znacajno vecem taktu od tih 2.66, nekih 25%, a to je realnih 3.33. Toliko ima C2D @ 3.46 Ghz, pa ta sitna razlika moze da se pripise vecem keshu i mozda fast radix 16 deljenju...
Realno, Penryn donosi 5% razlike osim u SSE4 optimizovanim aplikacijama i super duper suffle advanced unique engineu. :d
Zapravo, to je nesto malo doteran C2D sa jos malo kesha.
 
Poslednja izmena:
Inace bolji SPi rezultat moze da bude i posledica Intelovog dinamickog overklokinga pojedinacnih jezgara u single thread workload-ima. Prema tome, ako je Penryn na 2.66 dao 14 sec spi 1M, to lako moze da bude rezultat na znacajno vecem taktu od tih 2.66, nekih 25%, a to je realnih 3.33. Toliko ima C2D @ 3.46 Ghz, pa ta sitna razlika moze da se pripise vecem keshu i mozda fast radix 16 deljenju...
Realno, Penryn donosi 5% razlike osim u SSE4 optimizovanim aplikacijama i super duper suffle advanced unique engineu. :d
Zapravo, to je nesto malo doteran C2D sa jos malo kesha.

Ne gađajmo se tramvajima dok procesor ne izađe i dok svi ne odrade testove.. :)
 
Drugo je serverska ploca. Proizvodjac iz predostroznosti ne dozvoljava da radi bilo koji drugi CPU koji nije predvidjen trenutnim BIOS-om.
Verovatno su na serverskim plocama vise testirali, pa je dovoljno samo jedan bit-flip, ali na desktopu - mislim (kljucna rec: mislim) da nije samo to. (I bilo bi dobro da nije, jer onda znaci da Penny moze bolje).

Nego, gde si ti to video veci latency na penrynu ? Penryn u testu ima i veci fsb i manje latencije od referentnog C2D E6700.
Sad pogledah opet - obrnuo sam, CL5 za E6700, CL4 za Wolf-a. Sad mi jos sumnjivije izgleda, tako da opet sumnjam na BIOS ;-)
 
Ajmo iz pocetka. Latency zavisi i od FSB-a. Tako npr. Penny ima FSB 1333, a C2D 1066. To je latency drop od 30%, a pored toga su tajminzi ostriji na Penny-ju za 25%, sto mu dodje preko 50% manji latency. Pa ako je C2D trebalo 70 ns da pristupi ram-u ovome ce trebati oko 45 ns + sto ima veci kesh. Stoga ne cudi ako bi sa dinamickim klokovanjem u npr. igrama mogao da ima 20-30% veci FPS, jer u sustini ne radi na istom taktu. Brza memara, brzi FSB + veci klok, pa mora da radi brze.

Slazem se sa tobom da BIOS moze da pravi problem, ali ne toliko na vec gotovom Penny ready chipsetu. Sustina ovoga je da su u pitanju isti procesori, pa samim tim i ne mozes da ocekujes bog zna kakav skok performansi.
 
Ajmo iz pocetka. Latency zavisi i od FSB-a. Tako npr. Penny ima FSB 1333, a C2D 1066. To je latency drop od 30%, a pored toga su tajminzi ostriji na Penny-ju za 25%, sto mu dodje preko 50% manji latency.
Da, slozio sam se da Wolf ima manji latency I veci FSB, zbog cega me i cudi kako je sporiji u BILO cemu. Za Everest testove ne bi trebao da radi dyn overclock (multithreaded su), ali u svakom slucaju ne sme biti sporiji na istom taktu, ili tu nesto ne valja.

Slazem se sa tobom da BIOS moze da pravi problem, ali ne toliko na vec gotovom Penny ready chipsetu. Sustina ovoga je da su u pitanju isti procesori, pa samim tim i ne mozes da ocekujes bog zna kakav skok performansi.
Verovatno si u pravu. Intelovi testovi su najverovatnije pokazali primer dyn OC (i bolje ploce).
 
Ko kaze da je sporiji. Ipak, everest je sintetika, meni se cini da je vrlo slican Conroe jezgru po sirovom IPC broju. Oscilacije od 1% ne racunam. To moze da bude i do toga sto je sistem zaswapovao dok je testiran. :)
 
Stoga ne cudi ako bi sa dinamickim klokovanjem u npr. igrama mogao da ima 20-30% veci FPS, jer u sustini ne radi na istom taktu. Brza memara, brzi FSB + veci klok, pa mora da radi brze.

Dinamički overkloking je na Penrynu, a ne na Wolfdale-u.. Samo za mobilne čipove.
 
Ja sam pricao o Penryn-u a ne o Wolfdaleu. Sustina stvari je da je IPC vrlo verovatno kod novog priblizno isti kao kod starog 65nm jezgra. Dinamicki overkloking vazi i za desktop cipove.
 
Poslednja izmena:
Mislim da dyn OC ne vazi za desktop,bar ne za sada.
Videh na XS-u malopre,kazu dva XIP-a da nije ono rezultat na 2.66ghz za SPI ,definitivno.
Znaci cip je solidno OCovan,a koliko ne zna se :).
 
Ok, to znaci isto tako da je IPC Penryn-a ~ IPC-u Conroe-a.
 
Hehe, pa da, programerska logika ti je to ! :d Ne uzimamo mi pare na programu, nego na odrzavanju istog ! LOL

Kako ko.

Sto se tice vektorizacije, ***, ne mozes bas sve vektorizovati.

Skoro sve.

Ja verujem da su Borland, Intel, GCC i mnogi drugi u sebi vec imaju standardne biblioteke koje su vektorizovane.

Koliko ja znam samo Intel. Osim math i crypto, ima i SVML (small vector math library) uz kompajler i Intel Performance Primitives biblioteka. Njihov kompajler je inace u stanju da vektorizuje vecinu standardnih petlji. Razlika u brzini je 3-4x u poredjenju sa bilo kojim drugim kompajlerom.

drfedja je napisao(la):
Penryn kida SPi

Khm... :eyebrows:
drfedja je napisao(la):


audiofreak je napisao(la):


drfedja je napisao(la):
Latency zavisi i od FSB-a. Tako npr. Penny ima FSB 1333, a C2D 1066. To je latency drop od 30%, a pored toga su tajminzi ostriji na Penny-ju za 25%, sto mu dodje preko 50% manji latency.

Prvo, zaboravljas chipset i strapove u celoj prici. Veci FSB == relaksirani tajminzi za memorijski kontroler zar ne? Da ne pominjem razlicite memorijske kontrolere.

Drugo, sam Penryn ako radi na 2666 MHz njemu tajminzi nisu nista ostriji u odnosu na C2D na istoj frekvenciji bez obzira na FSB. Jedan CPU takt traje 1 / 2,666,000,000 Hz u oba slucaja.

ivanbo2003 je napisao(la):
Znaci cip je solidno OCovan,a koliko ne zna se

Na osnovu cega je to zakljuceno? Ni jedan screenshot ne pokazuje vise od 2671 MHz, a dinamicki O/C je samo za mobilne cipove:

Intel® Dynamic Acceleration Technology. For the mobile Penryn processor, Intel has enhanced the Intel® Dynamic Acceleration Technology available in current Intel Core 2 processors. This feature uses the power headroom freed up when a core is made inactive to boost the performance of another still active core.

drfedja je napisao(la):
Ok, to znaci isto tako da je IPC Penryn-a ~ IPC-u Conroe-a.

Ja se ne bih usudio da to zakljucim tako brzopleto pogotovo imajuci u vidu shuffle i radix16 divider.
 
To sam rekao jer su dva XIP-a to potvrdila,dinos je jedan od njih(btw ja mislim da je to nas covek iz Australije:),ili je bar poreklom sa Balkana,pa mozes da mu posaljes PM tamo na XS da ti potvrdi :) )
 
Poslednja izmena:
Nazad
Vrh Dno