Da li (bilo kako) moze da se optimizuje sledeci kod, osim vektorizacijom (sto bi Intel C/C++ compiler uradio):
for(i = 0; i < ARRSIZE; i++)
C = A ^ B;
ARCSIZE je min 16K, a max 16M (zavisi od slucaja do slucaja).
Vektorizacija je ubrzala na C2D cak 4 puta kod.
Ne izgleda preterano potreban kod, ali u slucaju da moze dovoljno da se optimizuje, i da u kombinaciji sa drugim pozivima da dobre rezultate, nameravam da uradim AoE i md RAID port na Windows ^^
for(i = 0; i < ARRSIZE; i++)
C = A ^ B;
ARCSIZE je min 16K, a max 16M (zavisi od slucaja do slucaja).
Vektorizacija je ubrzala na C2D cak 4 puta kod.
Ne izgleda preterano potreban kod, ali u slucaju da moze dovoljno da se optimizuje, i da u kombinaciji sa drugim pozivima da dobre rezultate, nameravam da uradim AoE i md RAID port na Windows ^^
Poslednja izmena: