Ať už se vám to líbí nebo ne, obrázky generované umělou inteligencí v poslední době doslova vybuchly v popularitě. Ještě na začátku roku byste zmínky o takových snímcích hledali jen těžko. Přitom teď, o pár měsíců později, už se jim na internetu nedá vyhnout. Jak jsme se do tohoto stavu ale vlastně vůbec dostali?

Všechno to začalo letos v červenci, kdy do veřejné bety vstoupilo DALL-E, a o měsíc později také Stable Diffusion. Výtvory obou těchto sítí v mžiku zaplnily sociální sítě. A tahle vlna zájmu jako by od té doby nepominula. Na svět totiž přicházejí stále další nástroje pro tvorbu obrázků i další způsoby, jak tyto sítě unikátně využít.

Sponzorem tohoto dílu je Samsung se svou novou řadou ViewFinity monitorů.

Obrázky generované umělou inteligencí

Jen abychom si to ujasnili, dnes se bavíme o systémech pro generování obrázků z textů. Neuronová síť se na množství vstupních dat naučí, která slova korespondují se kterými úkazy na obrázcích. Vy pak můžete zadat pár vlastních slov, na základě kterých se tyto neuronové sítě pokusí vytvořit co nejvěrnější obrázky.

Začněme u DALL-E. Tuto síť vytvořila firma OpenAI spoluzaložená Elonem Muskem. I když o síti mluvím jako o DALL-E, na mysli mám už její druhou verzi, která je veřejnosti dostupná v současnosti. Už původní neuronová síť ale vyrážela dechy.

Ti, kteří měli tu možnost si ji vyzkoušet ještě před otevřením beta verze, byli často ohromení realističností snímků, které síť produkovala. Nejinak tomu bylo i poté, co si ji mohla vyzkoušet veřejnost. Není tak divu, že právě DALL-E si zajistilo status vůdce na poli sítí generujících obrázky. DALL-E ale blokuje například generaci explicitních obrázků či obrázků, kde figurují známé osobnosti.

Skvělých výsledků dosahuje i díky tomu, kým je vyvíjena. OpenAI sítě pro porozumění jazyku staví už delší dobu, a tak není divu, že i DALL-E v tomto směru září.

To ale neznamená, že neexistují další sítě, které dosahují skvělých výsledků. Obrázky, ze kterých jde hlava kolem, vám vytvoří třeba i DreamStudio. Tady si dokonce můžete sami nastavit, jaké chcete, aby měl vygenerovaný obrázek rozměry či to, jak blízko má být k zadanému popisu.

NĚMECKÝ OVČÁK, KDYŽ JÍ HAMBURGER

Jak už vás ale mohlo napadnout, počítačový výkon neroste na stromech, a tak vás bude DALL-E i DreamStudio v lecčem limitovat. DALL-E nabízí zdarma možnost vygenerování padesáti různých obrázků a pak dalších patnácti každý měsíc. Pokud si budete s tímto silným nástrojem hrát více, připlatíte si.

Podobně je na tom i Stable Diffusion. To vám na generování obrázků věnuje 200 kreditů. Na kolik výtvorů vám to vystačí záleží na nastaveních. Propracovanější obrázek vám z vaší dvoustovky kreditů strhne i tři, zatímco méně propracovaný snímek vám nesebere ani jeden celý kredit.

Pokud se vám za generaci obrázků ale platit nechce, je tu alternativa, která je zcela zdarma. Jde o síť CrAIyon, která si dříve říkala DALL-E mini, byť s OpenAI nemá nic společného. I když nenabídne tak oslnivé výsledky, jako dříve jmenovaní konkurenti, hrát si s ní můžete jak dlouho jen budete chtít.

Pokud ale hledáte obrázky v umělečtějším stylu, je tu ještě jedna skvělá neuronová síť; Midjourney. Ta narozdíl od těch, které už jsem zmínil, funguje primárně na Discord serveru. I zde je zdarma pouze omezený počet generovaných obrázků. Pokud jich tak budete chtít vyrobit více než 25, zaplatíte si.

KOČKA NA STROMĚ

Využití v praxi

Takto generované obrázky už se dostaly i do TikToku, kde je můžete využít jako pozadí. Nejde ale zatím o nástroje na úrovni DALL-E, TikTok generuje pouze abstraktní snímky. I tak ale ukazuje, k čemu by později mohly být tyto sítě využívány.

Obrázky generované umělou inteligencí mají také obrovský potenciál uplatnit se třeba v marketingu. Možnost jednoduchého pořizování ilustračních snímků už zavětřil Microsoft, který brzy plánuje spustit svou platformu Microsoft Designer.

Ta má za cíl pomoct především firmám. Když budete chtít vytvořit třeba obrázek na sociální sítě, pouze napíšete, co byste na něm chtěli mít. Microsoft Designer pak s pomocí DALL-E obrázek navrhne a vy už vygenerovaný obsah pouze poupravíte podle vlastních představ.

A že Microsoft neplánuje zůstat pozadu ukazuje i se svým vyhledávačem Bing, který nově DALL-E také integruje. Obrázky si tak na základě textu můžete vygenerovat přímo tam.

Umělá inteligence jako generátor snímků ale není vnímána jen pozitivně. Nikdy totiž nebylo lehčí vytvářet zbrusu nová umělecká díla, a to třeba i ve stylech autorů, kteří ještě stále aktivně tvoří. Nebo vygenerované obrázky využít k šíření dezinformací, když třeba celebritu postavíte svým textovým vstupem do situace, ve které se nikdy nenacházela.

I proto se internetem valí bouřlivá debata, jak to vlastně je s autorskými právy. Tento způsob tvorby obsahu je totiž stále relativně nový, a tak se celý prostor kolem něj dostává do jakési šedé zóny. Takže ačkoli vám DALL-E povoluje vygenerované obrázky využít i za komerčními účely, nemusí to ve všech případech být správné.

Závěr

I když končíme na o něco rozpačitější notě, stále si myslíme, že tyto neuronové sítě jsou zkrátka úžasné. Určitě vám doporučuji se třeba do DALL-E přihlásit a pár snímků si nechat vygenerovat nebo zamířit na Discord Midjourney.

Ostatně, právě tento systém tvorby obrázků má možná velkou budoucnost, tak proč se mu bránit.