Zdroj: Dima Solomin / Unsplash
Magazín · Novinky · v úterý 28. 4. 2026 13:26
OpenAI představilo GPT-5.5, nejchytřejší model firmy
Závod o nejschopnější jazykový model se 23. dubna 2026 posunul o výrazný krok vpřed. OpenAI spustilo GPT-5.5, model, který firma sama popisuje jako svůj dosud nejintuitivnější a nejinteligentnější. Jako u každého vydaného modelu.
Nejde přitom o pouhé přidání výkonu navíc: GPT-5.5 bylo navrženo jako nástroj schopný převzít složité, vícekrokové úkoly a dotáhnout je do konce bez neustálého dohledu uživatele. Jinými slovy, místo pečlivého vedení každého kroku stačí modelu zadat nepořádný, vícevrstvý problém a on sám naplánuje postup, použije dostupné nástroje, zkontroluje výsledek a pokračuje dál.
Největší skok viditelný na benchmarcích se týká programování. Na testu Terminal-Bench 2.0, který ověřuje složité příkazové řádky vyžadující plánování a koordinaci nástrojů, GPT-5.5 dosáhlo přesnosti 82,7 %, zatímco GPT-5.4 skončilo na 75,1 %.
Výjimečné je přitom to, co modelu GPT-5.5 přidaly komentáře reálných uživatelů z raného testování. Zakladatel publikace Every popsal model jako první, který má při práci s kódem skutečnou konceptuální jasnost, a to poté, co GPT-5.5 dokázalo rekonstruovat opravu systému, na níž jeho tým pracoval několik dní.
Zásadním technickým úspěchem je samotná latence. Větší a schopnější modely jsou obvykle pomalejší, jenže GPT-5.5 dosahuje stejné rychlosti na token jako GPT-5.4 při výrazně vyšší inteligenci.
Srovnání s konkurencí je pochopitelně součástí každého takového oznámení. Z benchmarků vyplývá, že GPT-5.5 překonává Claude Opus 4.7 ve většině programovacích testů, přičemž v hodnocení SWE-Bench Pro naopak vede Opus 4.7 s 64,3 % oproti 58,6 %. Na poli abstraktního uvažování zase Gemini 3.1 Pro vítězí v ARC-AGI-1, ale GPT-5.5 výrazně vede v ARC-AGI-2 s 85,0 % proti 77,1 %. Žádný model tedy nekráčí bez porážky, ale GPT-5.5 se v celkovém průměru jeví jako nejkomplexnější nabídka na trhu.
Zdroj: Geoffrey Moffett / UnsplashOpenAI chce do roku 2030 provozovat 30 GW výpočetního výkonu pro AI
