Na konferenci Google Cloud Next 2026 v Las Vegas oznámily společnosti Google a NVIDIA zásadní rozšíření své dekádu trvající spolupráce. Jejím středobodem je nová generace cloudové infrastruktury označená jako A5X bare-metal instance, která je od základu navržena pro éru agentní umělé inteligence.

 A5X instance jsou prvními virtuálními stroji v portfoliu Google Cloud, které běží na nejnovějších čipech architektury NVIDIA Vera Rubin NVL72. Nová systémová platforma, vzniklá extrémní spoluprací na úrovni čipů, systémů a softwaru, má podle oficiálního blogu NVIDIA přinést až desetinásobné snížení nákladů na jeden token při inferenci a současně desetinásobné zvýšení propustnosti tokenů na megawatt spotřebované energie.

Srdcem škálovatelnosti systému je dvojice klíčových síťových technologií. Instance A5X využívají nové inteligentní síťové karty NVIDIA ConnectX‑9 SuperNIC, které jsou navrženy pro akceleraci AI zátěže v ethernetových cloudových prostředích. Ve spojení s novou generací síťové platformy Google Virgo umožňují zákazníkům propojit až 80 000 Rubin GPU v rámci jediného datového centra a až 960 000 GPU.

Nové instance jsou totiž přímou odpovědí na požadavky agentní umělé inteligence. Na rozdíl od jednoduchých chatovacích modelů spustí jeden uživatelský dotaz v agentním systému řetězovou reakci, kdy primární model rozloží cíl na dílčí úkoly pro specializované agenty, kteří mezi sebou kolaborují, udržují kontext a v reálném čase provádějí rozhodovací procesy. Pro takto komplexní a kontinuální výpočetní zátěž už architektura předchozí generace nestačí.