Šta je novo?

DualCore i za igrache

  • Začetnik teme Začetnik teme Nedjo
  • Datum pokretanja Datum pokretanja
3MaJ je napisao(la):
Ако се програмер ослони само на компајлер, може да се деси да коришћењем SSE "оптимизација" добије спорији код. Али, ако тачно за шта пише, дакле, критичне делове кода као
Kod:
asm{
.
<SSE инструкције овде>
.
}
Или користи SSE intrinsics (што је по мом скромном мишљењу решење боље од претходног ), добици на брзини су више него приметни!

Naravno da samo optimizacija samog source ima daleko najveci uticaj ali ovdje se ne radi o tome. U pitanju je nizi nivo optimizacije za odredjenu platformu.

kad se uporedi prednost i AMD i Intel sistema sa SSE na odnosu na FPU instrukcijama prednost dodje od prilike ista.

tako da je logicno da gore navedena aplikacija ako se kompilira na istom compajleru sa SSE optimizacijom da ce za obadvije platforme rezultirati prilicno istim povecanjem performansi.

Sto bi automatski znacilo da Intel nebi imao skoro nikakvu prednost u odnosu na AMD da je gore navedeni source cisti SSE !
 
Poslednja izmena:
Probao sam stare i nove drajvere. Za seriju sedam Forceware-a koristio sam 78.01, a za seriju osam, 81.95...


AMD Setup: AMD Athlon 64 3800+, 2x 512MB Kingmax HardCore DDR500, MSI K8N SLi, MSI GeForce 7800GT

Intel setup: Pentium D 820, 2x 512MB Kingston HyperX DDR2-900, ASUS P5N32-SLi, MSI GeForce 7800GT

AMD Setup...

3D Mark 05
78.01 - 14485
81.95 - 14016

AquaMark3
78.01 - 68134
81.95 - 79382

DoomIII - Low Quality

78.01 - 103.6
81.95 - 129.9 (lol)

FarCry - 800x600

78.01 - 82.87
81.95 - 100.57

Quake III - 1280x1024 HQ

78.01 - 551.4
81.95 - 528.7

Intel setup ne radi. Puca non-stop 3D 🙂 Ne valja memorija...
 
Poslednja izmena:
mala digresija na post o Serious sam2.Pomenuta igra kao i call of dutu 2 bili su na msinf4 amd3200 plochi za 1 giga ram-a.Promenim plochu,cpu i ram.Uzmem asus p5gdcPro i intel 630, 3.0,ram 533(512).Uspem da podignem isti xp na drugoj plochi i cpu.Namerno sam to uradio komparacije radi.Pustim Serious Sam 2 na istim podesavanjima.Ochekivao sam da zbog manje rama bude stucanja.Ali ne!radi isto!.A setovanja su skoro sva na mximumu.Isto je ina call off dutu2.I onda vidim posto o serious sam igrici gde amd "dere" intela.A to u praksi kod mene nije tako.Nikakvu razliku ne vidim sa 512 mega manje rama nego na AMD konfi..E sad ja nisam strucnjak za arhitekturu cpu,programiranje,instrukcije i sl.pa mi sve to nijej jasno.Jedina razlika do sada(2 dana)koju sam video je da se amd vrti na 33c-45c a intel na 43-55c.Doduse intel na box colleru a amd na gigabyte-ovom 700 grama teskom bakarnom 3d cooler-u.Pazi sad,a sistem nije nov,nego stari amd pa prepravljen za intel.Trebalo bi tek da se vidi razlika ali se ovaj "jadni inte, 3.0. "drzi".O chemu se radi-nemam pojma ali onda sve priche o brzinama padaju u vodu jer u praksi nisam video razliku.A vidim dobro.Mozda da izmerim programski koliko je fps terao jedan akoliko drugi pa da budem ubedjen...ali jbsh.te merache i programcice kad ja ne vdim brate razliku.
 
Poslednja izmena:
Pa lepo si sam rekao da bas i nisi strucnjak za arh racunara 😉
Pa evo logika malo: 120 fps na Amd-u(recimo,primera radi) i 100 fps na intelu(ovo isto proizvoljno)===> nikakva vidna razlika ali raw perf dobitak je 20%.Ti mozes da primetis samo ispod 25-35 fps da li secka ili ne.Sve preko toga je isto(mada je lepsi osecaj sa vise fps,oko 40-60 fps,zbog zahtevnih scena gde se desava da drasticno pada frame rate).Drugo doticni intel nije nimalo los cpu pa sad da krene da ti "koci" racunar i ostale gluposti.Sasvim dobar(i vise od toga 🙂 ) procesor.Inace nisi ni naveo koju graficku imas tako da ako je ista(i pozeljno 🙂 poslednje generac.) razliku i neces preterano osetiti(za sada 😀 )
Pozdrav
 
Poslednja izmena:
Pa ista je.pciexpress 6200 g force(nije neshto ali radi fino za ovaj novac).Pishe u potpisu.Hvala na pojashnjenu.Za to valjda i sluze ovi forumi.🙂
PS.Nema shtucanja ni kod zahtevnijih scena ili u situacijama kad te napada cela armada sa svih strana a ti se kreces kao ringishpil kako bi ih pokokao(najzahtevniji deo svih 3d igara).Ovo me je zbunilo jer imam 512(dodushe ddr2) manje RAM-a.Trebalo bi da "shtuca",obzirom da je ista igra radila na 1 giga pqi400 ram-a.
 
Poslednja izmena:
Dobro je sto lepo radi a nisi se cimao sa reinstall-om.Kao sto rekoh to je dobar proc. a 512 rama manje osetices u battlefieldu2 i slicnim "zverima"-bice zastajkivanja ako stavis zahtevnija(high)podesavanja za teksture.To sto je ddr2 ne dobija se mnogo(u odnosu na ddr1) u realnom radu.Gledaj da kad ustekas jos malo $$$ uzmes jos 512MB,mnogo ce ubuduce da znaci.Inace taj prosli amd je verovatno za igre bio (nesto) bolji,ali sve ostalo je tu negde(intel se zna gde je jaci 🙂 )
Pozdrav :wave:
PS Verovatno si imao neku povoljnu ponudu za zamenu/kupovinu jer procentualno se nece videti neka(pozitivna) razlika
 
Verovatno si imao neku povoljnu ponudu za zamenu/kupovinu jer procentualno se nece videti neka(pozitivna) razlika
Pa imao sam zamenu "glava za glavu".A dobio sam cpu koj podrzava ddr2 jer ddr1 ce polako nestajati sledece god.Nisam uopste planirao nikakvu zamenu ali je iskrsla zamena za novu plochu i cpu.Ostale komponente sam samo nakachio i raspalio da koristim.Inache M2 ce biti u 2006 ali ***.tada bi moja nf4 i 3200 venice bili dosta jeftiniji.Ovako sam uskochio i super.Ova plocha prima i ddr1 i ddr2,pci expressx16.Stize mi sutra josh 512 ram-a.I pre sam imao intel.Bio sam jako zadovoljan pogotovo sto imam obicaj da zadam racunaru vise zadataka u razlicitim aplikacijama(nedostatak vremena).Inache radim capture sa skystar2 pa posle obradu.Intel mi je omiljeniji tu.Kod ovih instrukcija u optimizacijama kod igara mi nije bilo jasno gde je tu razlika jer je nisam primetio samim tim sto sam stavio manje ram-a za koji kazes da nije neki zesci boljitak.Onda bi tek trebalo da se oseti jer imam slabiji cpu i manje ram-a/Ali isto je.Ali ajd nema veze sve ovo je u sustini nijansiranje za entuziaste.Meni ovo chudo radi dobro za ono za shta sam ga kupio.Pozdrav i hvala na odgovorima. 😉
 
Poslednja izmena:
monteboy je napisao(la):
A da nisi mozda dosao na ideju da su kompilirali Source koji bi radio i na masinama koje ne podrzavaju SSE2 cisto radi kompatibilnosti na dolje ?

Recimo Athlon XP savrseno podrzava graficke koje su u mogucnostima da odrade sasvim solidno posao. Zasto bi zbog bulja FPU'a jednog P4 zabranio korisnicima jednog Athlon XP'a ovu igru ?

Citas li ti pazljivo ili sta?

audiofreak je napisao(la):
Nije mi smesno, bilo bi dovoljno da su stavili /O2 /G7 /arch:SSE kad su prevodili program

Vidis da sam napisao SSE imajuci bas u vidu Athlon XP i Pentium 3. Oni cak ni to nisu imali u vidu.

3Maj je napisao(la):
Poenta - SSE2 uopste nisu morali da koriste, samo bi bilo sporije. SSE su mogli itekako.

Ne zaboravi da SSE2 ima i integerski deo (isto kao MMX samo dupla sirina registra). Ali apsolutno se slazem da bi SSE trebao biti minimum.

Monteboy je napisao(la):
SSE su mogli slazem se ali zbog cega onda to znaci da se isto nebi izvrsavalo i na AMD masinama brze ?

Iz istog razloga iz kog i dan danas Netburst brze izvrsava SSE i SSE2 kod?

Monteboy je napisao(la):
tako da je logicno da gore navedena aplikacija ako se kompilira na istom compajleru sa SSE optimizacijom da ce za obadvije platforme rezultirati prilicno istim povecanjem performansi.

Sto bi automatski znacilo da Intel nebi imao skoro nikakvu prednost u odnosu na AMD da je gore navedeni source cisti SSE !

Stalno ponavljam, a niko ne razume -- AMD jednako dobro izvrsava i FPU i SSE kod. Ako ga izvrsava jednako dobro onda ne moze SSE da izvrsava brze nego FPU jer bi to onda bilo "brze nego", a ne "jednako". Kod Intela je situacija drugacija, on izvrsava SSE/SSE2 dosta bolje nego FPU tako da on time dolazi na AMD-ov nivo, a AMD ostaje gde jeste, niti degradira niti profitira jer je vec na maksimumu koji moze da ponudi.

Monteboy je napisao(la):
konkretna razlika izemedju P4 i AMD sistema bi bila od prilike ista. Jedino ako koristis specialno Intelov kompajler sa G7 opcijom koju je audio gore pomenuo imas poseban benefit na P4 platformi jer optimizuje code posebno za NetBurst

Ne bih se kladio da bi bila ista razlika. Video si sta superpi patch moze da uradi, a to je bila zamena samo jedne legacy instrukcije.
/G7 opcija ima smisla i kad se koristi M$ compiler jer sve preko /G6 (PPro, P2, P3) omogucava kompajleru koriscenje MOVcc (conditional move) instrukcija umesto uslovnih skokova.

Monteboy je napisao(la):
Ipak nebih stavio tezinu toliko na SSE , to inache voli audio da koristi kao argumenat da bi odbranio Intel platormu. Usko grlo je uvijek bila memorija i pristup istoj gdje ja vidim najvecu prednost AMD arhitekture.

Juce sam bas poterao Everest na A64 3200+ S939 (nF4 Ultra) sa 2GB Geil 3-4-4-8 DDR400 memorije. Sva podesavanja su bila na defaultu. Rezultat za read je 5517MB/sec sto je skoro identicno kao kod mene na mom racunaru (5506MB/sec kad je sve na defaultu) tako da mi nije bas jasno sta si hteo da kazes. Ono sto stoji je da je latencija dosta manja na AMD-u ali to ima uticaja kod algoritama koji pristupaju memoriji nelinearno. Vecina optimizovanih aplikacija pristupa linearno i jednom kad streaming pocne brzina i bandwidth zavisi samo od radne frekvencije memorije i magistrale.

Monteboy je napisao(la):
Jednostavno mozes testirati uticaj -> izradi aplikaciju koja odradjuje recimo miliardu SSE operacija dok recimo svaka 100 operacija pristupi memoriji

i onda izradi drugu aplikaciju koja 100 puta pristupi memoriji a onda tek odradi jedan SSE proracun naravno sve ukupno miliardu puta videces enormnu prednost AMD arhitekture kad je cest pristup memoriji u pitanju.

Prvo, u prvom slucaju vreme ce biti konstantno i u direktnoj zavisnosti od trajanja svake instrukcije, a u drugom slucaju ako se pristupa istoj memorijskoj lokaciji ili ako je pattern pristupa regularan (rastuci) vec drugi (i svaki sledeci) pristup ce biti iz cachea i aktivirace se hardverski prefetcher tako da ce biti kao da pristupa memoriji ni nema.

Drugo, koja aplikacija ima potrebu da ucita sto podataka (i u sta kad nema toliko registara?) pa tek onda da radi neko racunanje? U praksi to ide max do 4:1 (mem. pristup : proracun), nikad do 100:1 tako da bi test bio sinteticki i ne bi znacio nista.

Sa jednim ces se valjda sloziti, a to je da je bolje bilo kakva optimizacija nego nikakva i da softver treba da koristi sve mogucnosti hardvera, a ne da ga sputava.
 
Poslednja izmena:
Evo u kom pravcu ce ici nove igre i kakve ce koristi biti od dual core procesora:

id Software has released a beta for Quake 4 that includes multi core CPU enhancements. This on the heals of the ATI 5.12 driver with enhancements as well. Intel was heavily involved, but hopefully there is no dirty pool going on here.
A BETA update for QUAKE 4 is now available. This update is recommended for Windows users with Intel Hyper-Threading Technology (HT Technology) enabled processors, multiple processors, or systems with a dual core processor. The update is also required for Windows and Linux server admins as it addresses a recently identified problem with servers left unoccupied for very long periods of time (these servers will appear to be operating normally, but will crash clients that attempt to connect to them). This update will bring any previous version of the game (1.0.0 or 1.0.4) up to date and will not affect pure server, PunkBuster compatibility or protocol consistency.

id Software and Raven have worked with Intel to dramatically improve QUAKE 4 performance on systems with HT Technology, multiple processors, or dual core processors. Players who have a system with one of these configurations will notice performance gains in QUAKE 4 of anywhere from 25% - 87% depending on processor type. If you do not know whether or not you have a multi-processor, dual core, or HT Technology enabled system, please see the ReadMe file for simple instructions on checking your system. Please use the form at www.idsoftware.com/bugs/ to report any issues you find with the 1.0.5 update.

Finally, although we've released only small (but critical) updates to QUAKE 4 so far, we are working on a much broader update for release early next year, and we also have a couple of multiplayer map packs currently being tested for release in the near future. Stay tuned
 
sta ce se desiti kad iz mode izadju procesori sa dva jezgra i pojave se novi sa cetiri?
hoce li i tad morati da se ceka da se aplikacije napisi za taj broj jezgara ili ce se ubrzanje videti na vec postojecim napisanim za dual core procesore?
 
Ser_Zile je napisao(la):
sta ce se desiti kad iz mode izadju procesori sa dva jezgra i pojave se novi sa cetiri?
hoce li i tad morati da se ceka da se aplikacije napisi za taj broj jezgara ili ce se ubrzanje videti na vec postojecim napisanim za dual core procesore?

Ovo zavisi od nekoliko stvari. Ako je aplikacija threadovana kako treba (znaci da # treadova odredjuje dinamicki i da koristi ~# threadova koliko ima i jezgara) i ako je workload dovoljno veliki da njegova podela na vise od dva jezgra ima smisla, a da pritom nesto drugo ne postane usko grlo (memorija, grafika, disk) onda ce ubrzanje biti "automatsko".
 
Nazad
Vrh Dno