Kétféle változatban készül az M2 Pro és Max

Az Apple a pontos specifikációkat ugyan nem jelentette be, de annyira azért nem titkolták el, hogy ne lehessen kideríteni.

Tegnap számoltunk be az M2 Pro és M2 Max rendszerchipekről, de az Apple-re jellemző, hogy a kezdetekben nem árasztják el a részletekkel a nagyérdeműt, így egy kis időt várni kell arra, hogy mit is tudnak az új lapkák. Jelen esetben az egyes verziók pontos specifikációja volt kérdőjel, hiszen az almás cég csak annyit árult el, hogy az adott lapkában mi lesz a maximális magszám, de azt már nem lehetett tudni, hogy a kicsit lebutított verziók mennyi maghoz jutnak.

Mára megtudtuk, hogy milyen CPU- és IGP-konfigurációk léteznek, és erről az alábbi táblázat ad felvilágosítást:

Apple M2 Pro és Max CPU- és IGP-konfigurációk
Típus Nagy teljesítményű CPU-magok száma (Avalanche)
Energiatakarékos CPU-magok száma (Blizzard)
Multiprocesszorok
(ALU-k) száma
M2 Pro
6
4 16 (2048)
M2 Pro 8 4 19 (2432)
M2 Max 8 4 30 (3840)
M2 Max 8 4 38 (4864)

Az IGP esetében egyébként az Apple a multiprocesszorokra továbbra is magként utal, de ez most se zavarjon meg senkit. Az M2 Pro és M2 Max esetében ez a részegység továbbra is megőrzi az iparágon belül extrém szélesnek számító, 128-utas feldolgozótömböt, méghozzá egy 4096 bites vektormotor formájában.

Ennek a felépítésnek főleg az az előnye, hogy a tranzisztorköltségek szintjén viszonylag olcsón építhető ki papíron nagy számítási teljesítmény, viszont az ilyen erőteljes a szálszintű párhuzamosságra rágyúró rendszerek esetében a legnagyobb kérdés mindig az, hogy van-e annyi feldolgozandó munkaelem, amelyek ráküldhetők a rendkívül széles egységre, méghozzá úgy, hogy kellő mennyiségű szál van azonos szemcsézettségű csoportokba rendezve. Ez ahhoz szükséges, hogy optimálisan át lehessen lapolni a memória-elérés késleltetését. Az Apple az M2 rendszerchipeknél is maximum 24 darab, azonos szemcsézettségű szálcsoportot, vagyis úgynevezett wave-et tud futtatni egy multiprocesszoron, és a korábbi dizájnokról származó tapasztalatok alapján azért 16 konkurens wave indítására legalább érdemes optimalizálni, hogy a memória-elérések során relatíve sokszor legyen azonnal futtatható wave. Ez a regiszterek tekintetében jelent nagy kérdőjeleket, hiszen a helyzet most is úgy foglalható össze, hogy legalább 16, de főleg 24 darab, 128 elemből álló azonos szemcsézettségű szálcsoport extrém sok helyet igényel a regisztereken belül, illetve a helyi adatmegosztást (LDS) tekintve, vagyis hiába kellene elméletben erre optimalizálni, komplexebb compute shaderek mellett ez rendkívül nehezen kivitelezhető a gyakorlatban.

Papíron tehát az új dizájnok ismét nagyon nagy számítási teljesítményt produkálnak, de minél erőteljesebb regiszter-, illetve LDS-nyomás, annál nagyobb annak az esélye, hogy egy multiprocesszor nem tud betölteni annyi azonos szemcsézettségű szálcsoportot, amivel a memória-elérés késleltetését az esetek többségében át lehetne lapolni. Ha ez a helyzet előfordul, akkor adatra fog várakozni a hardver, vagyis konkrétan nem számol semmit, amíg az adat meg nem érkezik, ezzel bukva a papíron nagy számítási teljesítményt.

Ezt a koncepciót az Apple nem először játssza el, és ultramobil szinten érthető is, hogy a cég nem számít nagyon komplex shaderek futtatására, de az új Macbook Pro esetében azért erre már nem feltétlenül jó építeni, hiszen ez mégis egy nagyobb teljesítményű, amolyan professzionális munkára szánt rendszer, ahol azért időnként beköszönnek a komplexebb shaderek. Valószínű, hogy a vállalat még az M2 termékcsaládot is valamennyire tanuló generációnak szánja, és talán emiatt nem szeretnék diverzifikálni a grafikus architektúrát, de idővel szükségszerű lesz, mivel ami jó ultramobil szintre, az nem feltétlenül optimális a professzionális igényekhez.

  • Kapcsolódó cégek:
  • Apple

Azóta történt

Előzmények

Hirdetés