Společnost OpenAI uvedla GPT-4o, nový model umělé inteligence, který přináší revoluční změny v interakci mezi uživatelem a počítačem. Model dokáže zpracovávat text, zvuk a obrazové vstupy a generovat odpovědi ve všech těchto formátech. Kromě toho rozpoznává emoce, umožňuje přerušení během řeči a reaguje téměř okamžitě, podobně jako člověk.

„GPT-4o je výjimečný tím, že zpřístupňuje inteligenci na úrovni GPT-4 všem uživatelům, včetně těch bezplatných,“ uvedla CTO OpenAI Mira Murati během živého přenosu. „Jedná se o významný pokrok v oblasti uživatelské přívětivosti.“

Během ukázek OpenAI ukázalo různé schopnosti GPT-4o. Model překládal mezi angličtinou a italštinou v reálném čase, pomáhal vědci řešit lineární rovnici na papíře a poskytoval rady k hlubokému dýchání na základě poslechu dechu jednoho z vedoucích pracovníků OpenAI.

Písmeno „o“ v názvu GPT-4o znamená „omni“, což odkazuje na jeho schopnost pracovat s různými typy vstupů. Na rozdíl od předchozích modelů, jako jsou GPT-3.5 a GPT-4, které převáděly hlas na text a tím ztrácely emocionální nuance, GPT-4o používá jednotnou neuronovou síť pro zpracování textových, vizuálních a zvukových dat, což umožňuje plynulejší a rychlejší interakce.