Každý, kdo sleduje vývoj umělé inteligence posledních dvou let, ví, že NVIDIA nehraje jen roli dodavatele grafických procesorů. Potvrdila to znovu, když vydala Nemotron 3 Super, zatím nejambicióznější přírůstek do své otevřené modelové rodiny, primárně zaměřený na agentní AI.

Zakladatel a generální ředitel NVIDIA Jensen Huang vydání komentoval slovy, že otevřená inovace je základem pokroku v oblasti AI a že NVIDIA chce prostřednictvím Nemotron proměnit pokročilou umělou inteligenci v otevřenou platformu, která vývojářům poskytuje transparentnost a efektivitu nezbytnou pro tvorbu agentních systémů ve velkém měřítku.

Jak se píše na oficiálním webu, Nemotron 3 Super je model s celkovým počtem 120 miliard parametrů, z nichž je při inferenci aktivních pouze 12 miliard, což je možné díky architektuře Mixture of Experts, zkráceně MoE.

model vždy aktivuje jen úzce specializovanou podmnožinu svých neuronových sítí přizpůsobenou danému úkolu, nikoli celou svou kapacitu zároveň. Výsledkem je výrazně nižší výpočetní náročnost při zachování vysoké přesnosti. Klíčovou inovací je přitom kombinace s architekturou Mamba-2, tedy stavovým prostorem, který zpracovává sekvence dat s lineární výpočetní složitostí místo kvadratické, která je typická pro klasické transformátorové modely.

Na benchmarku PinchBench, který hodnotí výkon modelů v roli řídicího mozku agentního systému OpenClaw, dosáhl Nemotron 3 Super skóre 85,6 % napříč celou testovací sadou a překonal otevřené i uzavřené modely srovnatelné velikosti.