Výzkumný tým Microsoft Research Asia nedávno odhalil pokročilý AI nástroj nazvaný VASA-1, který má schopnost přeměnit statický obraz člověka spolu se zvukovým souborem na realisticky pohybující se mluvící tvář. Nástroj, navržený pro real-time aplikace, dokáže generovat přirozené výrazy obličeje a pohyby hlavy, které synchronizují s hlasem ve zvukovém záznamu.

Přestože výsledky mohou být při detailnějším prozkoumání mírně mechanické, technologie naznačuje značný potenciál pro budoucí aplikace. Avšak s ohledem na možnost zneužití, jako je vytváření dezinformačních videí nebo falešného obsahu, se výzkumníci rozhodli zatím nezveřejňovat více podrobností ani nástroje pro širokou veřejnost. Zmínili, že čekají, až budou moci zajistit, že bude technologie používána eticky a v souladu s právními předpisy.

Kromě potenciálních rizik má VASA-1 také pozitivní využití. Výzkumníci naznačili, že by mohl pomoci zvýšit dostupnost vzdělávání a podporovat komunikační schopnosti lidí s určitými omezeními tím, že jim poskytne digitální avatary, které by za ně mohly komunikovat. Další možné využití zahrnuje terapeutické a společenské interakce prostřednictvím AI postav, které by mohly nabídnout společnost a podporu těm, kteří to potřebují.