Intel Atom vs. AMD Bobcat az x86-os csatamezőn

4. Az Isaiah mikroarchitektúra
1. Az Intel Atom 2. Az Atom mikroarchitektúrája 3. VIA Nano: a számkivetett 4. Az Isaiah mikroarchitektúra 5. Az AMD Bobcat 6. A Bobcat mikroarchitektúra 7. Specifikációk, tesztrendszer, fogyasztás 8. Szintetikus eredmények: memória-alrendszer 9. Szintetikus eredmények: utasítás-végrehajtás 10. Videóvágás, szerkesztés 11. Videókódolás, renderelés 12. Tömörítés, egyéb 13. Összesítés és végszó
Írta: Oliverda
2011-09-12 11:52

Az Isaiah mikroarchitektúra

Az Atom architektúrájával szemben a VIA Nano processzor teljesen más kategóriát képvisel: noha tervezési szempontjai között ugyancsak az elsők közt szerepelt az alacsony fogyasztás és a gazdaságos előállítás, mégis egy teljes, 3 utasítás széles out-of-order felépítésű processzorral állunk szemben.

A CPU a 64 kB-os, 16 utas csoportasszociatív L1 utasításcache-ből órajelenként 16 bájtot betöltve 3 db x86 vagy x64 utasítás dekódolására képes, ezek bármilyen komplexitásúak lehetnek. Az Intel processzorokban megismert micro-fusionhoz hasonlóan a lefordított, összetartozó (pl. betöltő és számítási) primitív RISC-műveleteket egyesítve küldi a végrehajtó egységek felé, legfejlebb hármat órajelenként. Képes továbbá az egymást követő összehasonlító és elágazási utasítások egyesítésére (macro-fusion).

Hirdetés

A végrehajtó egységekből szám szerint 7 van a processzorban, melyek out-of-order módon kapják meg a műveleteket, amint azok bemenő adatai rendelkezésre állnak:

Két, I1 és I2 névvel ellátott, egész számokon dolgozó egység, amelyek a szorzásokon és osztásokon minden integer műveletet végrehajtanak egy órajel alatt.
Az LD nevű címszámító a memóriaolvasásokhoz; a vele kapcsolatban álló Memory Ordering Buffer (MOB) képes az olvasásokat out-of-order módon átrendezni, akár az írási utasításokhoz képest is.
Egy-egy egység a memóriaírási műveletek címeihez (SA) és adataihoz (ST)
Az MA (Media A) kezeli az osztó, lebegőpontos négyzetgyök és integer SIMD műveleteket; továbbá ennek terepe az összes lebegőpontos összeadás, amelyeket 2 órajel alatt képes végrehajtani, amivel maga mögé utasítja az összes konkurens AMD és Intel processzort.
Az MB (Media B) egység a szorzó utasításokat kapja, amelyek közül a 32 bites Single Precision szorzásokat 3, a többit 4 órajel alatt hajtja végre, így ezen a területen is a többi gyártó megoldásai előtt, illetve velük fej-fej mellett van. Érdekesség továbbá, hogy képes a lebegőpontos FMA-számítások kezelésére; mivel azonban tervezése idején még nem álltak készen az ezt kihasználó utasításkészletek, így ezt a képességét csak a nagy bonyolultságú x87-utasítások (szinusz, koszinusz stb.). számolására szolgáló belső mikrokód-algoritmusok használják ki. A összes Media A és B által kezelt lebegőpontos SIMD művelet végrehajtása 128 bites, ahogyan az integer SIMD műveletek is 128 bites végrehajtókat kaptak. Támogatott utasításkészletei az MMX, SSE, SSE2, SSE3, valamint tartalmazza az Intel-féle virtualizációs megoldást és az x64 végrehajtási környezet támogatását is.

Külön érdemes megemlíteni az L1 utasításcache olvasásánál alkalmazott elágazásbecslő logikákat: nem véletlen a többes szám, mivel a tervezőgárda nem kevesebb mint 8 ilyen egységet épített be a processzorba, amelyek különféle szempontok szerint értékelik az aktuális szituációt, és egyfajta "szavazásos" módszerrel döntik el mindig, hogy a következő órajelben a CPU mely címről kiindulva folytassa az utasítások végrehajtását.

A processzort 64 kB méretű, 16 utas csoportasszociatív L1 adatcache-sel látták el, valamint 1 MB méretű, ugyancsak 16-utas L2 másodszintű tárral. Ezek exkluzív felépítésűek, azaz ugyanazt az adatok csak egyikük tartalmazza. Rendhagyó módon kezeli a Nano az adat-előbetöltéseket: a nagy valószínűséggel használt adatokat közvetlenül az L1D-be tölti be, viszont a nagyobb bizonytalansággal rendelkező spekulációknak egy külön 64 x 64 byte-os Data Prefetch cache-t tart fenn, így nem írja felül a cache-ekben tárolt "értékes" adatokat.

A fenti képen jól látható, hogy az out-of-order végrehajtásért felelős részek (MOB, Scheduler, ROB, Retire) mekkora területet foglalnak el.

Megszokhattuk a VIA-tól, hogy sokszor olyan, jövőbe mutató tulajdonságokat halmoz fel processzoraiban, amelyek a konkurenseknél csak később jelennek meg: ilyen pl. volt az AES (titkosítás) korai támogatása, illetve a Nanokban már megtalálható hardveres véletlenszám-generátor. Teljesítményben viszont jóformán mindig az Intel és az AMD mögött jártak.

A cikk még nem ért véget, kérlek, lapozz!

Kapcsolódó cégek:
Intel
AMD
VIA

Azóta történt

Az AMD két E szériás APU gyártását fejezi be

Lassan búcsút inthetünk az E-240 és E-350-es APU-knak?
AMD Bulldozer – kislapát vagy munkagép?

Nagyító alá helyeztük az AMD hosszan elhúzódott fejlesztésének első szülöttjét, az FX-8150 processzort.
Hamarosan lesz hitelesített driver az új generációs Atomhoz

Az Imagination Technologies rendszerprogramozói tartják a megcsúszott ütemtervet, ám a Cedar Trail platform közel sem lesz olyan, mint azt sokan várták.
PH!TV – The InnoVision Netbook, ezmiez?

Adott egy viszonylag régi ismerős hardverfronton, ami esetünkben az Atomot jelenti, van egy pár hivalkodó szín, ami most vörös, és egy barátságos árcédula, ez az InnoVision netbookja.

Előzmények

AMD Llano a mobil Sabine platformon

Az Asus N53-as laptopjában elemezzük az AMD új, izgalmasnak ígérkező mobil architektúráját.
A Nagy AMD Llano APU Megateszt

Ízekre szedtük a Llano lapkát és a rá épülő asztali A8-3850 és A6-3650 processzorokat is, 22 oldalon.
Az AMD Brazos platformja netbookokban

Egy kicsi Acer és egy nagyobbacska Asus netbookban vizsgáltuk a CPU-t és GPU-t ötvöző platform képességeit.
Az AMD Brazos platform tesztje

Asrock alaplapon érkezett hozzánk az első igazi Fusion, először a kisfogyasztású gépekbe.