Kép/videó AI rovat

Háborút indított a Google az AI árak ellen

Még több tárhely az AI mellé olcsóbban: lavinát indíthat a Google belépőszinten.

Rendezte: Mesterséges Intelligencia

Az Amazon három új animációs sorozatának készítésében oroszlánrész jut a cég Project Nara platformjának is, de állítólag az emberi munka is megmarad.

Microsoft Lens: ingyenes, saját gépen futtatható képgeneráló modell

A 3,8 milliárd paraméteres T2I képgenerátor a Microsoft szerint sokszor túlszárnyalja a FLUX, SD3 modelleket.

Feltalálta a Google a keresőmotort

Google A/I is lehetett volna az I/O neve, ahol Omni Man, bocsánat, Omni AI is megjelent.

Videokészítés a DeepSeek V4 Flash segítségével

Teszten a 284 milliárd paraméteres modell.

Alibaba Wan 2.7 Image Pro

Képgeneráló modell az egyik legjobb videógenerátor készítőitől.

Megérkezett a Midjourney V8.1!

Natív 2K, V7-es stílus és elképesztő sebesség!

Baidu ERNIE-Image: ingyenes képgenerátor. De sikerült?

A modell kiemelkedik a precíz szövegmegjelenítésben, a bonyolult utasítások pontos követésében és a strukturált képi tartalmak létrehozásában, miközben akár otthoni számítógépeken is futtatható.

ImagineArt 2.0: cél a stúdióminőségű vizuális tartalomgyártás

Az ImagineArt 2.0 egy professzionális és kereskedelmi célokra kifejlesztett, képgeneráló modell, amely a valósággal szinte megegyező, fotórealisztikus képek alkotására képes.

AI: tanulj már meg rendesen pózolni, ember!

Az AI pózerkedés lehet a Huawei Pura 90 legfontosabb újdonsága.

Google Lyria 3 Pro: zenegenerálás saját dalszövegből, képekből

Az új Google modell rövid klipek helyett professzionális dalok létrehozását teszi lehetővé dalszöveg, leírás és képek alapján.

Music Flamingo: audio AI, amely emberként értelmezi és magyarázza a zenét

Az NVIDIA modellje az Audio Flamingo architektúrára épül, és kifejezetten zenei adatokra lett továbbtanítva egy nagy, gondosan annotált dataseten.

Alamuszi AI: növekszik az utasításoknak ellenszegülő modellek száma

Egy friss tanulmány szerint fél év alatt ötszörösére nőtt az olyan esetek száma, mikor egy modell megpróbálta átverni felhasználóját.

Kipukkadt a videós AI lufi? A Sora elkaszálása csak a kezdet

Az OpenAI üthet szöget az ingyenes videógenerátorok koporsójába.

Reve v1.5: kreatív szakembereknek készült AI képgenerátor

A Reve v1.5 egy élvonalbeli, mesterséges intelligencia alapú képgeneráló eszköz, amely jelentős előrelépést képvisel a natív nagyfelbontású vizuális tartalomgyártás terén.

Microsoft MAI-Image-2: már a legjobbakkal versenyez?

A MAI-Image-2 AI képgenerátor jelenleg az Arena.ai ranglistáján a világ harmadik legjobbjaként szerepel.

Midjourney v8 alpha: szintet tud lépni az egykori legjobb képgeneráló AI?

Ez nem egy sima verziófrissítés. A modell sokkal pontosabban érti a promptokat, jobban kezeli a komplex jeleneteket, és a képek is egyben vannak.

Elképesztő új Photoshop AI eszköz: bármilyen fotót elforgathatsz 3D-ben!

A Rotate Object egy 2D-s fotót és egyetlen kattintással el tud forgatni térben, mintha csak egy 3D modell lenne.

Kling Video 3.0 Motion Control: animálj!

Az AI videógeneráló képes egy referenciavideó mozgását rendkívül pontosan átvinni egy statikus képre.

Így ismerd fel AI nélkül az AI képeket!

Nyolc hasznos tipp egy magyar kutatásból, ami hasznos lehet a választások előtt is.

LTX-2.3: ez komoly lett!

Az LTX-2.3 egyetlen rendszeren belül képes kiváló minőségű videót és azzal szinkronizált hangot létrehozni.

Google Nano Banana 2: trónfosztó az AI képgenerálásban?

A Google legújabb, Nano Banana 2 (Gemini 3.1 Flash Image) nevű mesterséges intelligencia képgeneráló modellje a gyorsaságot és a professzionális minőséget ötvözi egyetlen rendszerben.

Adobe Firefly Image 5: alkalmas csak képgenerálásra az Adobe legjobbja?

Az Adobe Firefly Image 5 (preview/public beta) változata 2025. október 28-án jelent meg az Adobe MAX 2025 konferencián.

Utcakép banánnal: félrecsúszhat a Google Térkép fókusza

Meglepő alkalmazásba költözhet a képalkotó modell, de vajon miért?

Recraft V4: jobb mint a Google Nano Banana Pro?

Képgenerálás és vektorgrafika készítés mesterfokon!

ByteDance BitDance: mire képes a szójátékgyőztes képgeneráló modellje?

A BitDance egy nyílt forráskódú, 14 milliárd paraméteres autoregresszív (AR) alapmodell, amely egy új, bináris tokeneken alapuló megközelítéssel valósítja meg a vizuális generálást.

Google Lyria 3: új zene szövegből, képből és videóból

A Lyria 3 a Google DeepMind legfejlettebb zenegeneráló modellje, amely képes szöveges leírások, képek vagy akár videók hangulata alapján énekkel ellátott zeneszámok komponálására.

Dalra fakad, zenét szerez a Gemini

Borítóképet alkot és a Geminiből is elérhető a Lyria.