Zdroj: Solen Feyissa / Unsplash
Magazín · Novinky · v pondělí 27. 4. 2026 18:18
NVIDIA připravila Day-0 podporu pro DeepSeek V4 na architektuře Blackwell
Čínská AI laboratoř DeepSeek vydala čtvrtou generaci svého vlajkového modelu a rovnou ve dvou variantách. DeepSeek V4 přichází jako DeepSeek-V4-Pro s 1,6 bilionu celkových parametrů (a 49 miliardami aktivních) a jako DeepSeek-V4-Flash se 284 miliardami celkových parametrů a 13 miliardami aktivních.
Obě varianty podporují kontextové okno jednoho milionu tokenů, maximální výstup sahá až na 384 tisíc tokenů přes API a obě jsou zveřejněny pod otevřenou licencí MIT. Spuštění proběhlo 24. dubna 2026 a NVIDIA si pro sebe nárokuje titul prvního, kdo měl plnohodnotnou podporu připravenou ještě ve chvíli vydání.
Klíčovým architektonickým pokrokem je hybridní mechanismus pozornosti kombinující Compressed Sparse Attention a Heavily Compressed Attention. V nastavení kontextu jednoho milionu tokenů DeepSeek-V4-Pro potřebuje jen 27 % výpočetních operací na jeden token a pouhých 10 % KV cache paměti ve srovnání s předchůdcem DeepSeek V3.2. Přeloženo do praxe, totéž hardwarové vybavení zvládne výrazně vyšší provoz, nebo stejnou zátěž obslouží s výrazně menší investicí do GPU paměti.
NVIDIA rovněž představila Day-0 podporu na GPU architektuře Blackwell a na čipech řady GB300 a Blackwell Ultra ukazuje předběžnou propustnost kolem 3 500 tokenů za sekundu na jeden GPU. Sama přitom zdůrazňuje, že jde o výchozí čísla, která porostou s dalšími optimalizacemi zásobníku Dynamo, CUDA kernelů a pokročilých technik paralelizace.
Zdroj: NvidiaSpolečnosti NVIDIA stouply výdaje na řešení reklamací o astronomických 1 000 %
