Kép/videó AI rovat
-
Utcakép banánnal: félrecsúszhat a Google Térkép fókusza
Meglepő alkalmazásba költözhet a képalkotó modell, de vajon miért?
-
Google Lyria 3: új zene szövegből, képből és videóból
A Lyria 3 a Google DeepMind legfejlettebb zenegeneráló modellje, amely képes szöveges leírások, képek vagy akár videók hangulata alapján énekkel ellátott zeneszámok komponálására.
-
Dalra fakad, zenét szerez a Gemini
Borítóképet alkot és a Geminiből is elérhető a Lyria.
-
Beleremegett Hollywood Brad Pitt és Tom Cruise AI harcába
Kongatják a vészharangokat: nem csak a szerzői jog, az egész mozi a tét.
-
Qwen-Image-2.0: képgenerálás, szerkesztés, részletesség, konzisztencia
Az Alibaba képgeneráló modelljének különlegessége, hogy képes rendkívül hosszú, akár ezer tokenes utasításokat is feldolgozni.
-
Besegít az AI a zöldségespultnál
Véget vethet a kódvadászatnak a Spar kísérleti mérlege.
-
Darabokban az xAI: a fél alapítócsapat lelépett
Kulcsemberek távozása követi a SpaceX-xAI egyesülést, sokan elégedetlenek a fordulatokkal.
-
LLPlayer: a legjobb videólejátszó nyelvtanuláshoz?
Valós idejű AI feliratozás és fordítás videókhoz!
-
A Grok Imagine Image: gyors, ingyenes, mindent is tud!
A Grok Imagine az xAI legfejlettebb multimodális modellcsaládja, amely a kiváló minőségű kép-, videó- és hanggenerálást egyesíti a precíz szerkesztési képességekkel és a valós idejű alkotáshoz szükséges sebességgel.
-
ACE-Step 1.5 telepítés
Az ACE-Step 1.5 egy hatékony, nyílt forráskódú zenei alapmodell, amely profi zene létrehozását teszi lehetővé közvetlenül a számítógépeden másodpercek alatt.
-
Anima: 2B szöveg-kép modell anime stílushoz
A modell jelenleg előnézeti (preview) fázisban van, natívan támogatja a ComfyUI környezetet, és a valósághű ábrázolás helyett a nem fotorealisztikus tartalmakra összpontosít.
-
CacheDiT: csökkentsd felére a kép- és videógenerálás idejét gépeden!
A cache-dit egy nyílt forráskódú, PyTorch-alapú következtetési motor, amelyet kifejezetten a Diffusion Transformer (DiT) modellek felgyorsítására fejlesztettek ki.
-
Suno helyett HeartMuLa: végtelen, ingyenes zene gépeden!
A HeartMuLa ökoszisztéma egy nyílt forráskódú zenei alapmodell-család, amelyet a zeneértés és -generálás előmozdítására terveztek.
-
LTX Audio-to-Video: videókészítés közvetlenül hangfájlok alapján
Ideális eszköz AI influencerek tartalomgyártásához, zenei videók vágásához és professzionális digitális történetmeséléshez.
-
Fotóból és videóból valós idejű 3D – LichtFeld Studio
Bemutatom, hogyan telepítheted és használhatod a LichtFeld Studiot – a Postshot nyílt forráskódú alternatíváját, amellyel 3D Gaussian Splatting jeleneteket hozhatsz létre.
-
Qwen Image 2512: képgenerálás 4 másodperc alatt Wuli 2steps LoRA-val!
A Qwen Image 2512 képgeneráló modellhez megjelent új Wuli 2steps LoRA lehetővé teszi a képgenerálást mindössze 2 lépésben, a szokásos 30-50 helyett.
-
Alibaba Z-Image Base: finomhangolás, negatív prompt, sokszínűség
A non-distilled Z-Image képgeneráló alapmodell több szempontból is felülmúlja a sebességre optimalizált Z-Image-Turbo változatot.
-
Készíts zenét ingyen a HeartMuLa és a Google Colab segítségével
A HeartMuLa ökoszisztéma egy nyílt forráskódú zenei alapmodell-család, amelyet a zeneértés és -generálás előmozdítására terveztek.
-
Kész vagy fizetni az AI-ért a Facebookon és az Instán?
Prémium élménnyel készül a Meta, de nem biztos, hogy tömegek fizetnek be rá.
-
FLUX.2 [klein] 4B - a gyorsnál is gyorsabb képgeneráló/-szerkesztő
A FLUX.2 [klein] a Black Forest Labs legújabb és leggyorsabb képmodell családja, amely egyetlen kompakt architektúrában egyesíti a szövegből képgenerálást és a fejlett képszerkesztést.
-
2D-3D-2D: kép forgatása mesterséges intelligenciával
Qwen-Image-Edit & Gaussian Splatting: egyetlen 2D-s fotóból 3D-s tér generálása, majd abban szabad kameramozgatás, végül újragenerálás.
-
Luxuspóráz: okosnyaklánccal készül az Apple
A nyomkövető méretű kütyü helyetted figyelne és hallgatózna.
-
FLUX.2 [klein]: villám AI képgeneráló+szerkesztő
A Black Forest Labs AI modellje egyetlen kompakt architektúrában egyesíti a szövegből képgenerálást és a fejlett képszerkesztést.
-
Z.AI GLM-Image: telepítés, RunPod futtatás
A GLM-Image elsősorban olyan területeken jeleskedik, ahol a hagyományos diffúziós modellek, mint a Stable Diffusion vagy a Flux gyakran elbuknak.
-
Z.AI GLM-Image bemutató
A GLM-Image egy nyílt forráskódú, képalkotó hibrid AI, amely 9 milliárd paraméteres autoregresszív nyelvi modellt kombinál egy 7 milliárd paraméteres diffúziós dekóderrel.
-
Ingyenes LoRA tanítás az Alibaba Cloud Modelscope weboldalán
A ModelScope az Alibaba Cloud által létrehozott nyílt forráskódú mesterséges intelligencia (AI) platform és modellközpont.
-
Így forgasd el utólag a fotóidat!
Történt már veled olyan, hogy generáltál egy tökéletes AI képet, de a szereplő rossz irányba nézett? Segít a Qwen Image Edit 2511 + ComfyUI Tutorial.
- Kerékpárosok, bringások ide!
- Milyen routert?
- RAM topik
- sziku69: Fűzzük össze a szavakat :)
- Luck Dragon: Asszociációs játék. :)
- Először beszélt bővebben az új Xbox konzolról a Microsoft
- PlayStation 5
- BestBuy topik
- Kertészet, mezőgazdaság topik
- A fociról könnyedén, egy baráti társaságban
- További aktív témák...