Společnost Google spouští nové funkce pro editaci obrázků v rámci své AI služby Gemini. Jde o výsledek práce výzkumného týmu DeepMind. Všechny obrázky, které budou pomocí těchto nástrojů vytvořeny nebo upraveny, ponesou viditelný i digitální vodoznak, aby bylo jasné, že vznikly za pomoci umělé inteligence.

Klíčovou novinkou je zaměření na konzistenci postav. Nový model dokáže udržet identický vzhled lidské postavy, i když uživatel pomocí AI mění její oblečení, pozadí nebo celkovou kompozici scény. Jde o řešení velkého problému, kdy AI při každé nové generaci měnila tváře a rysy osob.

K dispozici je i sada pokročilých editačních nástrojů. Uživatelé budou moci zkombinovat dva existující obrázky do jedné nové scény, použít vizuální styl z jednoho obrázku jako prompt pro druhý, a provádět vícestupňové úpravy jednotlivých prvků, aniž by se ztratily předchozí změny.

Jedná se samozřejmě o velký krok vpřed. Google se nachází v ostrém konkurenčním boji s platformami jako DALL-E od OpenAI nebo Midjourney.