Tömörítés, videokódolás
A tömörítőprogramok sebessége nagyban függ a memória elérésétől, ez főleg a WinRAR-ra igaz. Sajnos Windows Vista alatt a Phenommal egy sor teljesen értelmetlen eredményt kaptunk, ezért nem is igazán tudjuk figyelembe venni az értékelésnél. A 7-Zip szépen skálázódott a CPU-magokkal és az órajelek növekedésével. Becsomagolásban az Intel processzorok gyorsabbak, ha nem csal a szimatunk, akkor ez a két független 128 bites LSU portnak köszönhető (L1 cache). Kicsomagolásban, amikor az ALU-k és a visszaírás sebessége a döntő (2 x 64 bit a K10-nél a Core 1 x 128 bitjével szemben) a Phenomot csak a leggyorsabb Yorkfield képes elverni.
Ezeket a videokonvertáló programokat streaming jellegű alkalmazásoknak lehet hívni, hiszen folyamatosan, „özönvízszerűen” ontják magukból az adatokat. Ez a fajta számolás elsősorban annak a processzornak kedvez, amelyik gyorsabb a SIMD-végrehajtásban, feltételezve, hogy a program SSE-re van optimalizálva. A TMPGEnc ilyen. Mélylélektani elemzésünkben úgy láttuk, hogy a Core processzoroknak jobban fekszik ez a fajta munka, itt viszont mégis a Phenom szerepelt jobban egészen addig, amíg a Merommal hasonlítottuk össze. Ez szerintünk a 128 bites SIMD-végrehajtás mellett a duplájára gyorsuló L1 cache-nek köszönhető; hiába lenne gyors a K10 SIMD-ben, ha a végrehajtó egységeket nem tudná kellő mennyiségű adattal etetni. A Penryn SSE4.1-es kiterjesztésével (illetve az MPSADBW és PHMINPOSUW utasításokkal) szemben már tehetetlen volt.
A TMPGEnc-ben látottakkal ellentétben WME9 és x264-es kódolásban a Core volt a nyerő, nem szólva az iTunes-ról. Arra gondolunk, hogy a WME9 még kevésbé „SIMD-esített”, ezért az FPU-val is van némi dolga, vagy egyszerűen csak az utasításvégrehajtás felé billen a mérleg nyelve a cache-sebességgel szemben. Az x264-es kódolásban a Core kis előnyt élvez az SSSE3-as utasításkészlet miatt. Ha a támogatott utasításkészletek között megjelenik az SSE4 (a jelenlegi verzió még nem ismeri), akkor a Penryn el fog húzni. A Phenom csak az iTunes két szálon folyó konvertálásában maradt le jelentősen a Core-tól (lassabb volt, mint az Athlon 64), itt egyértelműen az FPU játszott szerepet; információink szerint ez annak tulajdonítható, hogy a K10-nél az FPU késleltetés több utasítás esetében is nagyobb, mint a K8-nál.
A cikk még nem ért véget, kérlek, lapozz!