Hirdetés

Új hozzászólás Aktív témák

  • -NoVa-

    őstag

    válasz FőDudu #29005 üzenetére

    Jujj :D

    Képfeldolgozásnál miért érthető, kockánál meg bonyolult? Kockánál van egy layoutod, igazából konkrétan 54 darab inputod 6 féle értékkel, és összesen 12 féle forgatási lehetőséged, és egyféle rendezés szerinti végállapot elérése a cél. Még ha kameraképből kell is az inputfieldet feltölteni, az 2-3 fotó megfelelő szögekből, utána már memóriából tudni fogja, épp mi hol van. Onnantól adatrendezési feladat, a lehető legkevesebb lépésből.

    Ehhez képest egy képnél igazából extrémsok input lesz. Érzékeltetem, tessék egy sima VGA videó Histogram of Oriented Gradiens leképezés. Igazából pixelenként egy pár vektor áll elő benne, és időben az előzményekből is. Ha jól megnézed, akkor még szemre is feltűnik a kép közepén parkoló VW golf, fényszórók, logo, rendszámtábla, olyan kontrasztok, amiket egészen könnyű leképezni egy algoritmusnak, hogy megtalálja az autót. Kicsit nehezebb a kocsitól jobbra lévő járdán sétáló bácsit felismerni vagy a kocsitól balra letámasztott bringát. Az előzményvektorokból pontos sebességbecslés meg házi feladat.

    Hogy számszerűsítsem, kb másfélmillió szám lesz a bemenő paraméter, azaz memóriában 1.5 MB feldolgozandó input. Igazából nem sok, realtime boldogul vele egy RPi is 25FPS-el. Csak aztán vesd össze a kocka 54 mezőjével, és gondolj bele, hogy az egyik miért pusztán egy egyetemi publikáció volt (azaz kb kötelező beadandó házi feladat), a másik meg az autóipar egyik legfontosabb aktuális problémája.

    Szóval most mégegyszer ideírom a kérdésed, hogy jobban el tudd képzelni az arcomon a döbbent röhögést, amikor elolvastam:
    "Ez igy kepfeldolgozasra ertheto.
    De hogyan csinalja a Rubik kockat?"
    :D

Új hozzászólás Aktív témák