Hirdetés

Qwen-Image-Edit: AI képszerkesztés - nem kell már Photoshop?

Ma egy olyan mesterséges intelligencia modellt fogunk megnézni, ami leegyszerűsíti a képszerkesztést: a Qwen-Image-Edit-et. Ez a modell az eredeti, nagy teljesítményű Qwen-Image alapjaira épül, és elképesztő képességeket hoz el a szöveges renderelés és a precíz képszerkesztés területén.

A Qwen-Image-Edit képességei és előnyei röviden összefoglalva:

- Ez a modell kiemelkedik azzal, hogy képes pontosan szerkeszteni a szövegeket a képeken belül, mind kétnyelvű (kínai és angol) környezetben. Ez magában foglalja a szöveg közvetlen hozzáadását, törlését és módosítását, miközben megőrzi az eredeti szövegméretet, betűtípust és stílust. Például képes helyesbítést végezni kalligráfiákban, vagy akár a legapróbb szövegelemeket is módosítani plakátokon.
- Lehetővé teszi a kép tartalmának módosítását, miközben megőrzi az eredeti vizuális szemantikát és konzisztenciát. Ez magában foglalja az IP (szellemi tulajdon) tartalom létrehozását (pl. egy kabalafigura módosítása különböző személyiségekhez), tárgyak elforgatását (akár 90 vagy 180 fokban, hogy láthassuk a hátulját), és stílusátalakítást (például egy portré Studio Ghibli stílusúvá alakítását).
- Precíziós részlet módosítása: Ez a funkció arra fókuszál, hogy a kép bizonyos régiói teljesen változatlanok maradjanak, miközben specifikus elemeket adunk hozzá, távolítunk el vagy módosítunk. Példák erre egy cégtábla hozzáadása és a hozzá tartozó tükröződés generálása, apró tárgyak vagy hajszálak eltávolítása, egy adott betű színének megváltoztatása, vagy egy személy ruházatának és hátterének módosítása.
- Lépésről lépésre történő szerkesztés (láncolt megközelítés): A Qwen-Image-Edit lehetővé teszi a felhasználóknak, hogy progresszíven javítsák a hibákat a képeken, például kalligráfiai alkotásokon. Ez azt jelenti, hogy bounding boxok segítségével jelölhetők ki a korrigálandó területek, és iteratívan végezhetők el a módosítások a kívánt eredmény eléréséig.
Miben jobb, mint mások?

- Nem csak képeket generál vagy szerkeszt, hanem érti is azokat, így egy átfogó alapmodellé válik az intelligens vizuális alkotásra és manipulációra, ahol a nyelv, az elrendezés és a képek konvergálnak.
- Nyílt forráskódú ökoszisztéma. A modell natívan támogatott a ComfyUI-ban, és a HuggingFace és ModelScope platformokon is elérhető, ami széles körben hozzáférhetővé teszi a fejlesztők és a felhasználók számára. Az optimalizációk, mint az alacsony GPU-memória igény, FP8 kvantálás és gyorsítási módszerek, tovább növelik az elérhetőségét és hatékonyságát.

Parancsok:
002 (Szövegek eltávolítása):
Remove all UI text elements from the image. Keep the feeling that the characters and scene are in water

003 (Szöveg módosítása egy menetben):
Change "ComfyUI News" to "Mp3Pintyo News"
Change "Qwen Image Edit is now available in ComfyUI" to "May the Mp3 be with you"

004 (Szöveg módosítása több lépésben):
Multiple rounds of editing:
Round 1: Change "ComfyUI News" to "Qwen Image Edit"
Round 2: Change "Qwen Image Edit is now available in ComfyUI" to "Edit the image and keep the style consistent"

006 (Ember lecserélése):
Change the woman to strong man

007 (szám cserélése)
Change the number "23" to "13"

008 (háttér cserélése)
Change the background to Wall Street

009 (háttér cserélése, ne cserélje a nőt)
Change the background to Wall Street. keep to woman face and color unchanged

010 (ruha cserélése)
change the woman's clothes into an elegant suit

011 (póz megváltoztatása)
The woman should hold a green apple in her left and right hands, which she is showing to the camera. Change the background to Wall Street

013 (póz megváltoztatása)
The woman is standing on Wall Street.

014 (forgatás)
Show the woman from the left side

015 (forgatás)
Show the woman from the right side

016 (forgatás)
Show the woman from behind

017 (forgatás)
Rotate the woman 90 degrees

019 (élethűvé alakítás) (4 lépéses lora)
Transform the image into a photorealistic style