Před pár dny Google představil svůj nový model umělé inteligence zvaný Gemini, který plánuje v různých podobách integrovat do svých služeb. Výrazné ohlasy sklidilo zejména ukázkové video, kde kalifornský softwarový gigant předváděl jeho působivé schopnosti. Gemini v něm například dokázalo v reálném čase reagovat na obrázek, který uživatel kreslil na papír.

Skutečnost ale může být trošičku jiná. Sám Google totiž v popisku na YouTube potvrdil, že pro účely videa byly urychleny odpovědi umělé inteligence. To v praxi znamená, že na reakce AI modelu byste mohli čekat výrazně déle, než Google naznačoval.

Úpravou videa se podrobněji zabývala agentura Bloomberg, pro kterou se Google k situaci vyjádřil daleko podrobněji. Z komentáře společnosti přitom vyplývá, že ukázka v podstatě vůbec neodráží skutečné schopnosti Gemini, anebo ji svět pouze úplně špatně pochopil.

Video naznačovalo, že uživatel může s Gemini provozovat plynulou konverzaci, jako by komunikoval s lidskou bytostí, zatímco umělá inteligence reaguje na podněty, které se okolo uživatele dějí. Realita je ale jiná. Při přípravě videa uživatel vůbec nekomunikoval s Gemini hlasově, a navíc se interakce neodehrávaly v reálném čase. Použity byly „statické snímky ze záznamu a textové příkazy“, sdělila společnost Google agentuře Bloomberg.

Nedlouho po zveřejnění článku Bloombergem se na platformě X vyjádřil Oriol Vinyals, jeden z vedoucích celého projektu Gemini. „Všechny uživatelské výzvy a výstupy ve videu jsou skutečné, zkrácené pro stručnost. Video ilustruje, jak by mohly vypadat multimodální uživatelské zážitky vytvořené pomocí Gemini. Vytvořili jsme ho, abychom inspirovali vývojáře,“ prohlásil.

Gemini, respektive jeho Ultra verze, ale i tak dosahuje slušných výsledků. Ve většině relevantních benchmarků překonává o pár procentních bodů GPT-4 od konkurenční organizace OpenAI. Jediným problémem je, že je Google pozadu. Práce na GPT-4 totiž byly dokončeny už před rokem, zatímco Gemini Ultra je stále ve fázi přípravy.