- Házimozi haladó szinten
- Milyen videókártyát?
- 3D nyomtatás
- VR topik (Oculus Rift, stb.)
- Házi barkács, gányolás, tákolás, megdöbbentő gépek!
- Milyen processzort vegyek?
- Az árnyak közül lépett spotfénybe az MSI 16 GB-os grafikus kártyája
- Androidos fejegységek
- Steam Deck
- AMD K6-III, és minden ami RETRO - Oldschool tuning
Hirdetés
-
SteamWorld Heist II - Középpontban a történet és a küldetések
gp A folytatás érkezésére kicsit még várni kell, az új rész augusztusban debütál.
-
Huawei Watch Fit 3 - zöldalma
ma Megnéztük, hogy tényleg okosóra lett-e a Huawei fitnesz karperecéből.
-
AMD-s alternatívát ajánl az NVIDIA AI ellen a Microsoft
it AMD-s alternatívát kapnak az NVIDIA AI-processzorokra a Microsoft felhős ügyfelei.
Új hozzászólás Aktív témák
-
cwn
tag
nem volt eleg a larrabbee bukasa, most ezzel is beegetik magukat?
a die kepen nincs L2 cache , csak sok kis ocska vegrhajto egyseg, ez a felepites alkalmatlan barmire2012? addigra az nvidia learatja a piacot, vicces ez az intel
-
cwn
tag
a larrabee fejleszteset iranyito mernokot ugy rugtak ki mint macskat szarni, vajon mert, mert sikeres a cucc?
tobb problema van ezzel a rendszerrel, eloszor is iszonyatosan memoria savszel igenyes, nvidianal 400GB/sec-ekkel dobaloznak
emellett igen nagy cache igeny is jelentkezik, a fel chipnek cachenek kene lenniea harmadik problema a threadek kezelese, mivel mindegyik kis nyomorek mag csak 4 threadet kezel , ezert tobbnyire varakozo allapotban vannak , adatra varva
sajnos ahogy az nvidia is csinalta , egyseges thread kezelo egyseg kell ilyen kornyezetbe , tobb ezer threaddel -
cwn
tag
a larrabee-t az ibm-sony cell mintajara fejlesztettek , azt hittek hogy az lesz a jovo, csakhogy kozbe kiderult hogy alkalmatlan a cucc, a cell is megbukott, programozhatatlan foshalom, csak mar keson derult ki, nem volt visszaut
mig az nvidia kivart , es kepes volt a cell architectura gyengesegeit kijavitani es igy jott letre a fermi, ami szetalaz minden mast -
cwn
tag
tudod amikor mar maga az ibm is atall a fermi-s serverekre, a cell fejleszteset meg dobja akkor ne akard bemeselni a cell el es virul , egyedul a ps3-ban van cell ami detto bukas
http://www.bit-tech.net/news/hardware/2010/05/20/nvidia-tesla-gpgpu-scores-ibm-server-win/1
-
nagyúr
Azért én láttam Blade szerverben is működni és nem mondhatnám, hogy egy bukott architektúra teljesítményét láttam (nem beszélve a Roadrunner teljesítményéről, ami ugyan hibrid, de van benne Cell is). Mivel nem új, nyilván nem mérhető a Fermihez, de azért koránt sincs vége a Cellnek, csak épp nem a te szegmensedben kell csupán körülnézni...
-
nagyúr
Gondolom az nem foglalkoztat, hogy egy Blade és a Fermi nem pont ugyanarra való... és gondolom az sem zavar, hogy egy PS teljesítményét hoztad össze egy Fermiével... Én nem akarlak meggyőzni, mivel nem is egy kategória, de engem se kell téríteni, hidd el. Eleve alapvetően más a két architektúra. És gondolom egy bukott cuccból nem adnak el 30 milliót.
[ Szerkesztve ]
-
Abu85
HÁZIGAZDA
A Cell-t továbbra is használja az IBM, csak egy fejlesztést állítottak le. A PS3 nem a Cell miatt volt gondban. Hülye volt a Sony politikája. Jöttek a pokoli teljesítmény dumával miközben a júzer látta, hogy a multiplatform játékok jobban néznek ki xBox 360-on. Amióta az exkluzív címekre alapozzák a marketinget, azóta jól megy a PS3 szekere.
[ Szerkesztve ]
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
cwn
tag
-
Surfym@n
senior tag
Idézet a linkelt cikkből:
"In an interview with Heise.de, IBM's VP of Deep Computing, David Turek, confirmed that the Cell processor has reached the end of the line. Turek then put a more positive spin on the news by stating the obvious truth that heterogeneous multiprocessors, of which Cell was the first mass-market example of, are here to stay, so insofar as IBM continues to produce such chips, Cell's basic concepts and ideas will live on in the company's product line."
Ez nagyjából a lényeg is (a többi csak bővebb kifejtése a cikknek), miszerint a Cell proci csak egy állomás volt, de az alapkoncepciót továbbviszik. Nyilván itt is valami általános feladatokra kihegyezett "dinnyét" akarnak kifejleszteni
Cikket is kéne olvasni, nemcsak főcímeket...
cwn meg monnyon le!
(ezzel a stílussal, meg okoskodással még Kiszel Tünde is lealázná, miután leereszkedett a szintjére )[ Szerkesztve ]
28 év és 2.8-as rekesz felett már nincs mese...
-
cwn
tag
tisztazzunk valamit, a cell proci nem az ibm-e volt, a sony ment az ibm-hez hogy ilyen processzort szeretnenk, itt van ra 2 milliard $ , az ibm megcsinalta , es vallalt bizonyos marketing tevekenyseget az osszegert, mihelyt a sony nem pumpalt tobb penzt , az ibm kukazta az egeszet, es valtott fermire
ez a valosag, minden mas csak mese
-
cwn
tag
mar 2005-ben a cellrol beszelgettem a cell fejlesztojevel, igaz a neveket torolte a rendszer, hiaba regen volt, de cell ugyben nem sok ujat tudnanak mondani
[http://www.ibm.com/developerworks/forums/thread.jspa?threadID=93624&tstart=3420]
[ Szerkesztve ]
-
nagyúr
Akkor azt is tisztázzuk, hogy itt csupán a HPC mainstream kategóriáról beszélünk és az ebben a kategóriában fellelhető szerver(ek)ről. Egyébként nem csoda, ha leváltanak egy közel 10 éves rendszert, mint ahogy az sem, hogy egy 2010-es Fermi leveri ezt, de ettől még a Cell-ről nem jelenthető ki, hogy rossz vagy hogy kukába való... ez elég korlátolt nézet. Akkor az is kijelenthető, hogy az Audi 100 rossz volt csak azért, mert az új jobb?
(#20) cwn:
Aha...[ Szerkesztve ]
-
9950es
aktív tag
És azzal a raytracing gyorsítókártyával lesz vajon valami?
millió dologra lehetne használni grafikán kívül is egy játékban
120 fps or GTFO :D
-
cwn
tag
ha szeretnel olvasni 100 olalnyi forumhozzaszolast a cellrol itt megteheted
remelem nem baj ha belinkelem a konkurenciat
en ott voltam vegig, csak tudnam minekhttp://forum.hwsw.hu/topic/64624-cell-by-sony-toshiba-and-ibm/page__hl__ibm%20cell
-
nagyúr
Nem szeretnék olvasni 100 oldalt. Mint mondtam, nem szükséges meggyőzni engem, láttam működni, elég volt arra, amire kellett és jónak tartom továbbra is, szóval nem bánom, ha a Fermi, ami évekkel később készült, többre képes. Még jó, hogy így van... de azért kösz a linket, másrészt egy 2004-es hsz ma már nem sokat nyom a latban.
-
9950es
aktív tag
Rendes tőzsdetippeket adjatok már...
120 fps or GTFO :D
-
#95561216
törölt tag
Korábban az apple-topic, most ez.. Gabucino, te vagy az?
-
FRENK1988
veterán
Ez a csávó ugy néz ki mint B Gordon
Nem a lóerő öl, hanem a NYOMATÉK! :)
-
Raymond
félisten
cwn, ne egesd magad tovabb vazze...
Privat velemeny - keretik nem megkovezni...
-
vanhalen
senior tag
válasz #06658560 #34 üzenetére
Érdekes dolgok ezek cwn, meg abu szövegében látok érveket, meg "válaszokat" de a többi... fikázás és passz. Szubjektív véleményecskék részinformációk taglalásával hehe
Egyébként pártatlan vagyok, nem ismerem egyikőtöket sem, de a "teljesítményt" látom
Vicces (és tipikusan MAGYAR) -
#06658560
törölt tag
-
Maverick14
tag
Tévedés, a 65nm-es PowerXCell 8i-ben már javítottak a DP műveletvégzés sebességén, ugyanannyi órajel alatt végzi el mint az SP-t. Így 102.4GFLOPs az elméleti számtási teljesítménye egy Cell processzornak.
LINPACK alatt 100GFLOPs-os átlagot mértek: [link].
A Fermi-re úgy tudom még nincs hasonló független LINPACK mérés. Szóval az elméleti számítási teljesítménye szép nagy, kérdés hogy a gyakorlatban mennyit lehet kihozni belőle.A sok kocaprogramozó pedig aki nem tud megbirkózni a Cell programozásával valószínűleg a közeljövőben megjelenő sokprocesszoros architektúrákat sem fogja tudni hatékonyan programozni.
My other car is an F-14 Tomcat!
-
wad
tag
"sajnos ahogy az nvidia is csinalta , egyseges thread kezelo egyseg kell ilyen kornyezetbe , tobb ezer threaddel"
Ja, úgy kell, ha SIMD videokártyát szeretnél csinálni. És még a cache nagyrészét is ki lehet dobálni. A helyzet viszont az, hogy nem minden algoritmust lehet videokártyára párhuzamosítani. Ha minden igaz, akkor a Knights Corneren viszont többszálú x86-ként lehet programozni. Más kategória.
-
Raymond
félisten
válasz Maverick14 #37 üzenetére
"A Fermi-re úgy tudom még nincs hasonló független LINPACK mérés."
Mar van valami hasznalhato. A ket napja publikalt juniusi Top500 lista masodik helyezetje a Nebulae rendszer. Ez 4640 node, mindegyikben 2x Xeon 5650 es 1x Tesla C2050. Az Rpeak 2984300 GFlops. Ebbol a Xeon-ok adnak kb. 593771 GFlops-ot, a maradek kb. 2.39 TFlops a Tesla-ktol jon. Az elert teljesitmeny a 1271000 GFlops.
Figyelembe veve hogy a sima Xeon-os rendszerek a listaban olyan 85%+ hoznak az Rmax-bol igy a vegeredmenybol saccolhato hogy a Tesla kb. 32%-at adja a sajat maximumanak:
(1271 - (594*0.85))/2390 = 0.32 kb.
[ Szerkesztve ]
Privat velemeny - keretik nem megkovezni...
-
Maverick14
tag
Már van új TOP500 lista? Le vagyok maradva. Köszi, az infót a Fermi teljesítményéről, kb. ekkora kihasználtságra tippeltem volna.
Visszatéve a hírhez.
Összehasonlítva a MIC-et a tavaly bejelentett SCC-vel érdekes, hogy ebben az újabb architektúrában már koherens a cache. Pedig az SCC-vel kapcsoltban még a szoftveres koherenciát és a "transactional memory" előnyeit ecsetelgették. Mondjuk a magok is vektorosak lettek, úgy tűnik mintha az Intel két tervezőcsapattal is dolgozna. Az egyik a Tera-Scale Research Processor, SCC a másik a Larrabee vonalat viszi.My other car is an F-14 Tomcat!
-
UnSkilleD
senior tag
válasz Maverick14 #42 üzenetére
intelnek sok fejlesztő csapata van aztán a végén a product group dönti el hogy miből lesz kiadható termék
itt egy fasza interjús cikk SCC-ről[ Szerkesztve ]
"Az internet olyan, mint az MTV: annak idején az MTV nagyon trendi volt, aztán hirtelen elavult” - Prince
-
cwn
tag
-
cwn
tag
válasz UnSkilleD #43 üzenetére
a fasza az azert tulzas, kezdoknek jo kis cikk, de mikor ilyeneket ir hogy 1 memoria kontroller kiszolgal 12 magot akkor kicsit elfog a rohogogorcs
egy 3 Ghz-es procinak 10 orajelenkent kell adat a memoriabol , a larrabee mag 256 bites, ami 16 byte, tehat 300*16= 5 GB/sec olvasas, ugyanennyi iras , tehat lehet azt mondani hogy egy maghoz durvan 10 GB/sec kell, igy az 50 maghoz kell 500 GB/seces memoria atvitel
mivel ilyet manapsag nem lehet nagyon csinalni , kene hozza 1000 lab a chipen, igy akkora cache-t kell ratenni a chipre amekkorat csak el tudunk kepzelni -
nagyúr
Köszi az értékelést, a többiek nevében is. Jó az, amikor valaki az alapján dönt, amit éppen olvas és nem az alapján, amit tud.
Egy örök mondás:
bizonyítson az, aki úgy érzi, szükséges az igazát mindenképpen bizonygatni.A többi (hogy mit gondolsz) a te dolgod...
cwn:
Szerintem az xbit labs egy pöttyet többet ért hozzá. Van némi tapasztalatuk... meg talán a fejlesztőknek is[ Szerkesztve ]
-
cwn
tag
bocs de mit ertesz azon hogy jobban ert hozza, latod hogy meg az intel sem ert hozza , mert a larrabee ugy megbukott mint a vocsok,
akkora memoria savszel meg a chipen belul sincs , csak a fele annak amit irtam mint minimum , pedig a memoria alrendszer hatekonysagat meg bele se szamoltam
legalabb az ibm a cellel a chipen belul tudta tartani az igenyeket, a memoria ott is csak a fele lett a szuksegesnekmarketing rizsa ez az egesz chip , ami keptelen a hatekony mukodesre, majd ha kihoznak igy lassan 10 ev fejlesztes utan valamit ami mukodik majd leborulok az intel mernokei elott, de addig had rohogjek
[ Szerkesztve ]
-
Raymond
félisten
"de az biztos hogy cell vagy larrabee alatt rosszabb az arany , 10-20% max"
A Roadrunner-en a Cell (PoweXCell8i) vegzi a Linpack szamitasainak gyakorlatilag az egesz erdemi reszet es az efektivitas 75% : [link]
A #45-ben irtakra pedig nincs mit mondani, teljes zagyvasag az egesz.
Privat velemeny - keretik nem megkovezni...
-
cwn
tag
a dupla pontos szamitasok alatt ugye 1/8-ra esik a cell teljesitmenye , azon a memoria rendszer mar nem tud sokat rontani , ez ugy 12.5%-os chip kihasznalas, es meg ennek a kb 80%-a jon ki valosagban, magyaran 10%-osan van kihasznalva a chip
ehhez a meglevo memoria rendszer boven eleg2 evig tanultam a cellt programozni , a 10 ezer oldalas doksit is olvastam, ez csak ugy megjegyzeskeppen , hogy tudd kivel vitatkozol
[ Szerkesztve ]
-
cwn
tag
a cell amugy nem rossz, van par hibaja ami javithato, de csak profi koder tudja kihamozni belole a teljesitmenyt
viszont a mai programozok nem ilyenek, sose lattak assemblyt, csak c#-t , es emiatt megbukott az egesz , mert olyan processzor kell ma amihez a hulyek is ertenek, na a fermi ilyen , es egy kezdo is kiszed belole 60%-ot
a cellbol csak vert pisalva lehet 80%-ot kinyomni, meg sok idovel ami sok penzt is jelent, nem alkalmas jovo processzornak -
nagyúr
500 GB/sec a nem tul tavoli jovoben nem tul tavoli. Itt van pl. a Blue Water, ahol ket tetszoleges csomopont kozott lesz 192 GB/sec (nagy B, nem kicsi) az atvitel.
Na most a ket tetszoleges csomopont az azt jelenti, hogy adott esetben egy nagy terem ket szele.
while (!sleep) sheep++;
-
nagyúr
Nem a profi koder kerdese elsosorban, hanem a megoldando problemae. Ugyanez all a Fermire is.
Peldaul egy darab FFT-t egy buzi nagy adatszeten akkor sem tudsz jol megirni Cell-re vagy barmilyen GPGPU-ra, ha te vagy az orszag legnagyobb assembly magusa , viszont kepfeldolgozast meg barmelyik masodeves egyetemista kitol Cell-re vagy barmi hasonlora.while (!sleep) sheep++;
-
cwn
tag
nagyon is tevedsz, egy processzor sikere a kodereken mulik, ha a cellbol keptelenseg 20%-nal tobbet kihozni atlagosan , atlagos programozokkal, egy fermibol meg barmikor kiaramlik a 60% akkor az azt jelenti hogy 6 evvel le van maradva a cell , holott a csikszelesseg ugyanaz
az meg hogy a masodeves cellt programoz csak hiu abrand, max copy pastezik meg ganyol -
nagyúr
Sajnos nem arra valaszoltal, amit irtam.
egy processzor sikere a kodereken mulik
1: ez nem igaz, ezer mas dolgon is mulik, a kodereken talan a legkevesbe, ugyanis a koderek nagy resze azt csinalja, amiert fizetik, a legtobb 'komoly' cegnel vannak olyan koderek, akik megfelelo mennyisegu penzert megcsinaljak azt, amit elvileg ki lehet hozni a cuccbol
2: a kodereken nem mulik, hogy egy feladat elmeleti szinten hatekonyan paralellizalhato-e az adott architekturan -- ha nem, akkor az John Carmack se fogja jol megoldaniNem mondtam egy szoval sem, h a Cell nincs lemaradva a Fermihez kepest.
while (!sleep) sheep++;
-
cwn
tag
talan ha az FFT-t nem az iskolaban beledsulykolt modszerekkel akarnad vegezni, hanem mondjuk egy frekvencia analizisre felepitett neuronhalozattal probalnad, amiben a cell kozel 100%-os hatekonysaggal tud dolgozni, akkor nagyobb sikereket ernel el
de talan meg a DFT is hatekonyabb egy cell architecturan mint az FFT, mivel ezeket az algoritmusokat meg a lyukkartyas szarokra talaltak ki, igy neha nem art ujragondolni, hogy talan egy ezer orajeles latencyyvel rendelkezo cellen , nem epp az az algoritmus a megfelelo amit oregapam hasznalt lyukkartyaba lukasztva
ugyanez ervenyes a rendezesre, mert talan az egyetemen meg ma is a quicksort a meno, ami a legrosszabb algoritmus a foldon, en be is tiltanam, a radixal a cell 1 millird adatot rendez sorba framenkent[ Szerkesztve ]
-
nagyúr
Altalaban az ilyen arrogans stilus heveny kisebbsegi erzest takar
talan az egyetemen meg ma is a quicksort a meno, ami a legrosszabb algoritmus a foldon
Termeszetesen ez nyilvanvalo butasag, a radix ugyebar O(kn)-es, es k jellemzoen nem kisebb, mint log(n). Az, hogy a Cellhez pont a radix stimmel, az egy dolog, attol a qsort nem lesz rossz rendezesi algoritmus, mas kerdes, hogy nem mozogsz olyan feladatok kornyeken, ahol ezt kellene hasznalni (vagy mozogsz, csak nem jossz ra ).A neuronhalozattal a Cell akkor boldogul jol, ha alacsony az interkonnektivitas, a DFT-zo neuralis halo meg (legutobbi informacioim szerint) a spektralkomponensekkel aranyos szamu neuront igenyel, 100%-os interkonnektivitassal. Ha tudnal hatekonyan mukodo GPGPU-s vagy Cell-es rekurrens neuralis halo-implementaciora peldat mutatni, megkoszonnem, meg sosem talalkoztam ilyennel.
while (!sleep) sheep++;
-
Raymond
félisten
Akkor inkabb valami massal kellett volna az idodet tolteni mert meg alap dolgokat se vagy kepes a jelek szerint megerteni meg az itteni hozzaszolasokbol sem:
1) DP alatt csak az elso (pl. a PS3-ban is talalhato) verzio teljesitmenye esik jelentosen, a Roadrunner-ben a PowerXCell8i van aminel az SPU-k alltal adott DP teljesitmenye az SP fele (102.4 GFlops)
2) Ezt ugy hasznalod ki amilyen jo programozo vagy es amennyire az adott problema megengedi
3) A linkelt Top500 eredmeny a standard Linpack DP eredmenye, ugyhogy van aki kihozta belole amit kelettPrivat velemeny - keretik nem megkovezni...
-
cwn
tag
http://www.cubic.org/docs/radix.htm
"This is a short tutorial on Radix-sort. If you already know what radix-sort is, how it works and you don't use quicksort anymore you can skip this tutorial."
csak kezd az alapoknal
-
nagyúr
Gratulalok a szovegerteshez (ha mar helyesirni nem tudsz)
(Legalabb olvastad volna el, amit linkelsz, es latnad, hogy milyen celra ajanljak -- nezz utana, hogy melyik sort mire jo, nem veletlenul van tobbfajta...)(Meg esetleg valaszolj a neuralis halos kerdesemre, tenyleg erdekel, hogy tudsz-e altanos celu, elosztott rekurrens NN-szimulatort..)
[ Szerkesztve ]
while (!sleep) sheep++;
-
cwn
tag
-
cwn
tag
ertem mit irsz, es igazad is van , de attol meg hogy az ibm egy-ket profi asmos sracot raszabaditott a primko linpack optimizalasra, hogy bevakitsanak a vilagnak, meg nem valtozik semmi, a cell fejleszteset leallitottak , mert egy kalap kaki, ha a c#-s fejlesztok raszabadulnak , es csak hoborognek hogy hol van az igert teljesitmeny
-
Maverick14
tag
Az általad linkelt cikkben szó sincs arról hogy ez a megoldás gyorsabb lehet mint pl. a Matlab FFT függvénye. Kapunk egy neurális hálót amivel hasonló problémáink lesznek mint pl. a radix-2 FFT-vel, nevezetesen hogy mindenki mindenkivel össze van kötve. Tehát egy bizonyos méret felett ugyanúgy memóriasávszélesség korlátos lesz a feladat mint a radix-2 FFT esetén.
Ha már Cell és FFT akkor ezt érdemes megnézni: [link]
(Talán olvastad te is ezt, ha már olyan régen foglalkozol Cell programozással... Amúgy az egész itteni párbeszédről a következő klasszikus szösszenet jutott eszembe [link] )My other car is an F-14 Tomcat!
-
Raymond
félisten
Csak az a helyzet hogy az utobbi par evben nem a Linpack volt az egyetlen ahol elertek normalis eredmenyeket 1-2 IBM-es "profi asmos" emberrel hanem egy rakat project volt publikaciokkal egyutt. Meg egyszer - az hogy te nem tudtal vagy tudsz valamit megcsinalni nem jelenti azt hogy mas sem tud. Ha annyti foglalkoztal volna vele akkor tudnal ezekrol a publikaciokrol. Mondjuk minimum egyrol tudnod kene meg ha nem is bujod az akademia alltal publikalt munkakat vagy epp kulonbozo cegek alltal publikalt white paper-eket.
Privat velemeny - keretik nem megkovezni...
-
-
cwn
tag
válasz Maverick14 #65 üzenetére
cellen es fermin azok a neuralis halok gyorsak amik befernek a localis memoriaba, amikor mar el kell kezdeni cserelgetni a neural tomboket a fomemoriabol akkor mar hatarozottan lassul a kod,
engem igazabol azok a halok erdekelnek amivel robotok mozgasvezerleset lehet megoldani, ezzel foglalkoztam egy ideig, es meg valszeg fogok is, ha ilyen doksit ismersz veletlen akkor nyugodtan linkelheted, bar van sajat otletem, csak a halo tanitasaval vannak meg problemak, de megoldom azt is mihelyt lesz ra idom -
nagyúr
Köszi az értékelést... gondolom az fel sem merült benned, hogy van, akit más terület érdekel, nem csupán a neurális hálók. Én videókódolással foglalkozok hobbiból és amit a Cell nyújtott, számomra elég volt. Nyilván a Fermi többszörösen lekörözi, bár még nem próbáltam, de ettől talán nem lettem "elmeroggyant"... vagy igen?
(egyébiránt a fórum nem chat, megtanulhatna mindenki magyarul, ékezetekkel írni, ettől nem lesz valaki nagyobb szaki szerintem)
[ Szerkesztve ]
-
cwn
tag
nem neked szantam ,meg nem is sertesnek, csak keves az az ember akivel erdemben lehetne beszelgetni, ezert is szerettem a hwsw-t ,ott ezek az emberek tobzodtak, csakhat mar megdoglott a forum ottan,es ezzel az agressziv velemenycserevel tesztelem mennyi szaki is van itt a forumon
-
nagyúr
Na igen, kb. errol van szo -- nincs olyan architektura jelenleg, ami valoban parhuzamosan tudna neuralis halot futtatni. A 'gyors' algoritmusok arrol szolnak, hogy az aktivitasok propagacioja nagyon gyors (e.g. a matrixmuveletek), de ahogy a matrix kilog, baj van -- es alapesetben ugye ez azt jelenti, hogy olyan 1000 neuron nagysagrendben kezdodnek a problemak.
Ha valakinek van kedve ezen gondolkozni, akkor szoljon, rendes penzeket lehetne erre szerezni.
Robotok mozgasvezerleset onmagaban nem igazan praktikus haloval megoldani szerintem, de jatszani jopofa dolog. (Konkretan a kontroll erdekel, azaz a mozgastervezes, vagy az intelligencia resze?)
while (!sleep) sheep++;
-
cwn
tag
engem fokent az emberi mozgas robotokra atultetese erdekel, tehat olyan neuronhalo aminek van memoriaja, es tudja tarolni a mozgas mintakat,dinamikat
meg csak kiserletezgetek vele, eloszor csak jatekban a karakterek mozgasara szeretnem adoptalni , igy olcsobb , mint real robotokon tesztelni , mukodik is a cucc, csak a tanitasa gyotrelmes meg, minden neuron sajat 3d-s memoria tombbel rendelkezik, es a kulso ingerek vezerlik hogy a neuron milyen utvonalon szedje ki az adatokat a memoriabol
ha van otleted hogy lehetne feltolteni ezeket a 3d-s tomboket adatokkal , ne tartsd vissza -
dezz
nagyúr
Te, haver, állítsd már le az agyad helyén lévő mókuskereket egy pillanatra és nézzél ki egy kicsit a fejedből, mielőtt ennél is nagyobb hülyét csinálsz magadból... Aki itt megbukott valamiben, az valószínűleg te magad vagy, Cell programozásban... Kár volt beléd az adófizetők befektetett pénze és a tanáraid ideje... Erre nem lennék büszke.
A PowerXCell8i, amit Raymond éppen abban a hozzászólásban említett, amire válaszolva te folytattad a bla-blát, na szóval ez a Cell változat fullos double-precision támogatással rendelkezik. Számos szuperszámítogépben alkalmazzák (mint fő számolóegység, a gépekben lévő Opteronok a memóriaalrendszert vezényelve igyekeznek adattal ellátni), melyek közül több benne van a Supercomputer Top10-ben, a (valós) teljesítmény/fogyasztás arányt is figyelembe vevő Green500 listának pedig első helyeit foglalják el.
A Fermiről annyit, hogy hiába a nagy elméleti teljesítmény, az állítólagos több TFLOPS, csak a legegyszerűbb számításokban jön ki a valóságban, összetettebb dolgokban a Cell 10x hatékonyabb...
Az se zavarjon, hogy az AMD APU megoldása közelebb áll a Cellhez, mint a Larrabee. (Persze nem minden részletében.)
[ Szerkesztve ]
-
dezz
nagyúr
"a cell jatekprogramozas szintjen erdekelt, a tudomanyos munkak vele nem nagyon , meg amugyis lejart lemez a cell mar regota"
Csak nem Versiont köszönthetjük itt körünkben, aki először az egekbe magasztalta a Cellt, a sci-fi határait súroló game development tervekkel, majd amikor le kellett volna ülni mindezt megvalósítani (némi kézikonzolos gyakorlattal, ami 1db játékot jelent), beletört a bicskája, minek utána éppen az ellenkezőjére fordult a Cellről vallott véleményének előjele? (Valamit kihagytam?)
-
dezz
nagyúr
Magával a Cell architektúrával sem állnak le:
"We managed to get hold of an IBM spokesperson an hour ago [még az említett közlés napján] and they said that only one CPU development cycle is being 'halted' which is the successor to the current PowerXCell-8i cpu. IBM have said they are planning to work on other CPU's in the Cell Processor 'family' [...]" [link]
Valószínű a feljesztés közben kiderült, hogy az adott csíkszélességen nem lett volna rentábilis, így inkább átlépik.
ps. a töltelék hsz-eket képzeljétek hozzá.
-
Maverick14
tag
Hagyományos mikroprocesszoron is azoknak a neurális hálóknak a szimulációi fognak jól menni aminek az adatai beférnek az L2 cache-be. Az igazi kihívás az, hogy nagyobb adathalmaz esetén úgy alakítsd ki az algoritmusod adatfolyamát, hogy ne veszíts a sebességből a szűkebb memória sávszélesség miatt.
Én Celluláris Neurális Hálózatot (CNN) szimuláltam Cell-en, ez egy lokálisan összekötött hálózat, ott meg lehetett oldani úgy a dolgot hogy mindig csak a cellatömb néhány sorát tároltam az SPE memóriájában. A sorok betöltését és az eredmény kimentését ügyesen át lehet lapolni a cellák állapotának kiszámolásával.
A neurális hálóknak hatalmas irodalma van én csak a CNN-es részt ismerem valamennyire abból is a különféle platformokon történő megvalósítással foglalkozom. Szóval azt tudom javasolni hogy keress egy neurális háló modellt ami jól illeszkedik az adott feladathoz és ha használhatónak de lassú akkor foglalkozz a gyorsításával akár Cell-en, GPU-n vagy FPGA-n.My other car is an F-14 Tomcat!
-
cwn
tag
nem esik nehezemre beismerni hogy , nem kicsit koppantam a ps3 -nal, nem gondoltam hogy ilyen durvan meg fog ugrani a minoseg, a fejlesztesi koltseg , es a jatekok altal igenyelt fejlesztok szama
de a cellt nem ezert tartom bukonak, egyszeruen a sony elkurta , es a sony fanatizmusom ezzel a vegere is ert, sokkal tobbet ki lehetett volna hozni ebbol , de ok csak egy nyamvadt konzolt akartak, amibe most meg maga a sony is belebukik
a cell jo , jobb mint egy x86-os szutyok, csak az a baj hogy papiron letezik, mivel nem lehet vele gepet kapni, viszont a fermi mar ujabb es jobb, hatekonyabb, mar felesleges a cellel erolkodni is, ennyi volt az eletciklusa -
dezz
nagyúr
Akkor tulajdonképpen mi is a problémád a Cellel?
Lehet vele gépet kapni, csak nem olcsó... PCIe kártyán is elérhető a PowerXCell8i, bár ez sem valami olcsó. Nem mintha egy Tesla az lenne.
Még mindig labdába rúghat az előbbi az utóbbival szemben, ami a telj./fogy. arányt illeti. Ahol ez kevésbé számít, ott az utóbbi a nyerő. Nem csoda persze, van egy pár év közöttük. (Viszont pl. hatékony kódot úgyanúgy nem gyerekjáték rájuk csinálni. Igaz, több is a nyers erő.)
Igen, a 32 SPU-s PowerXCell jégre let téve (legalábbis átmenetileg, mivel úgy fogalmaztak, hogy halted, nem cancelled, vagy akármi, de mindegy). Viszont lehet hallani egy olyan verzió fejlesztéséről, ahol a PPE-t egy rendes Power mag helyettesíti. Azt nem tudom, hány SPU lesz benne, de nyilván nem kevés és nyilván az LS mérete is nagyon lesz. Szóval, ez még messze nem dőlt el.
Új hozzászólás Aktív témák
Állásajánlatok
Cég: Ozeki Kft.
Város: Debrecen
Cég: Alpha Laptopszerviz Kft.
Város: Pécs