Az AMD 2011 elején mutatta be a Brazos platformot, mely elsőként alkalmazta a cég alacsony fogyasztású Bobcat processzorarchitektúráját. Azóta eltelt több mint másfél év, és a Brazos platform a vállalat történetének legsikeresebb termékévé vált, hiszen ilyen időintervallumban soha semmiből nem adtak el ennyi terméket. A Brazos sikere tehát kétségtelen, de az eredeti utódnak szánt Deccan platform törlésével az AMD sokak szerint túl kényelmesre vette a figurát. A cég nyilván látja, hogy a konkurencia még a Brazost sem képes megfogni, így a 2.0-s frissítés logikus döntés volt, de idővel minden terméknél lehet jobbat alkotni, így jövőre már biztos nem úszható meg a tényleges újítás.
Az AMD korábban már leleplezte, hogy a Brazos platform Zacate APU-ját a Kabini SoC APU váltja. Ez a lapka új processzormagokat kap, amelyek a Bobcat utódnak szánt Jaguar architektúra épülnek. Ezt a vállalat az idei Hot Chips 24 rendezvényen mutatta be, bár túl sok konkrétum a teljesítményről nem hangzott el, de elég sok információ látott napvilágot el a fejlesztésekről.
A Jaguar már 28 nm-es gyártástechnológián készül, szemben a Bobcattel, amely a TSMC 40 nm-es gyártósorait kamatoztatja. Az AMD nem részletezte, hogy mely bérgyártónál képzeli el a gyártást, de nagyon valószínű, hogy a TSMC és a GlobalFoundries 28 nm-es node-jára is készül dizájn, illetve a piaci igényektől függően a Samsung kapacitása is igénybe vehető. Egy Jaguar mag kiterjedése egyébként 28 nm-en 3,1 mm², vagyis a Bobcat 40 nm-es, 4,9 mm²-es területéhez képest jó irányba fejlődött a rendszer. Persze a méretcsökkenést főleg a kisebb csíkszélesség hozta. Fontos, hogy az előbbi értékek másodszintű gyorsítótár nélkül értendők.
A Jaguar magból összesen négy darab lehet egy lapkában. A Kabini SoC APU a jelenlegi adatok szerint csak olyan kiépítést tartalmaz, ahol ez teljesül is, de a tabletekbe szánt Temash SoC APU-ból lesz két- és négymagos verzió. A Bobcathez képest komoly változás, hogy a magok dedikált L2 gyorsítótár helyett egy közöset használnak, melynek mérete 1-2 MB lesz, magonként 512 kB-os szeletekkel. Az előadást vezető Jeff Rupley kitért arra, hogy az L2 gyorsítótár esetében mindig kérdés, hogy magonként legyen dedikálva, vagy esetleg legyen megosztott. Mindkettőnek megvannak az előnyei és a hátrányai. A megosztott gyorsítótár növeli az elérési időt, de a mai programok többségében jellemzően előnyösebb ez a megoldás.
A funkcionális változások tekintetében szintén nem aprózta el az AMD az újdonságot. A Jaguar mag természetesen a Bobcat által támogatott összes szolgáltatást és utasításkészletet kezeli, amit még kiegészítenek az SSE4.1, SSE4.2, AES, BMI és AVX utasításkészletek. Ezek többsége nem meglepő, de az AVX például az. A Jaguar ennek támogatását egy 128 bites FADD és egy szintén 128 bites FMUL egység segítségével oldja meg, vagyis a 256 bites AVX utasításokat két 128 bites részre osztva hajtja végre a rendszer, tehát gyorsnak nem nevezhető, de egy alacsony fogyasztású processzormag esetében ez is jóval több a vártnál. Természetesen a 128-128 bites FADD és FMUL egység a 128 bites SSE utasításokra pozitív hatással lesz, hiszen azokat a Bobcattel ellentétben a Jaguar már nem osztja két részre. A magon belül az L1 gyorsítótárak mérete nem változott, így az új rendszer továbbra is 32-32 kB-os adat és utasítás cache-sel dolgozik. A Jaguar azonban magonként alkalmaz egy-egy 32 bájtos loop buffert, ami időt és energiát takaríthat meg, ha a kódban hosszú ciklus van. Az integer rész nem sokat változott a Bobcathez képest, de feltűnhet a Div, azaz az osztómotor, mint extra, amit az AMD a Llano processzormagjából emelt át. A Jaguar az osztást kétszer gyorsabban végzi, mint az előd, továbbá a komplex operációk – az optimalizálásoknak hála – szintén kétszer gyorsabban futnak majd a felújított architektúrán. Fontos még megjegyezni, hogy az AMD megtartotta az out of order elvű feldolgozást az új processzormagon, de erre számítani lehetett.
Az AMD szimulációi szerint az IPC (órajelenként végrehajtható utasítás) 15%-kal nőtt a Bobcathez viszonyítva, a Jaguar órajel-frekvenciája pedig 10%-kal lehet nagyobb az elődnél. Tekintve, hogy alacsony fogyasztású rendszerről van szó, így az energiagazdálkodás is fejlődött. A Jaguar mag terhelés nélküli kapuzása 98,8%-os hatékonysággal működik, ami a Bobcat 91,8%-os értékéhez képest előrelépés, továbbá terhelés mellett a megosztott másodlagos gyorsítótár üzemelhet az alapórajel felén is, ha az nem jelent érzékelhető lassulást az adott feladatra nézve. Ezzel szintén sok energia spórolható meg.
Lényegében tehát a Jaguar minden szempontból előrelépés a Bobcathez képest, de ez várható is volt. Amire talán nem számított senki, az az AVX támogatásának beépítése, de az ilyen extrának mindig örül az ember. Sajnos az AMD csak a processzormagról beszélt, így a Kabini SoC APU többi része rejtély, de annyit elárult a vállalat, hogy az integrált grafikus vezérlő az új GCN architektúrára épül, így ebből a szempontból is jelentős előrelépés várható. Ezt az információt ugyanakkor már korábban is leleplezte a cég, így túl nagy meglepetés nem ért senkit. Az viszont látszik, hogy a Brazos platform méltó utódot kap, és ha a következő év első felére tervezett megjelenést is tartja az AMD, akkor talán a Deccan platform törlését is elnézik a potenciális vásárlók.