NewsObjavljeno:19. apr. 2026, 23:45

Nvidia je predstavila Nemotron 3 Super, model odprte umetne inteligence z 120 milijardami parametrov, zasnovan za agenske delovne obremenitve

Nvidia je predstavila Nemotron 3 Super, odprti hibridni model s skupno 120 milijardami parametrov, zasnovan za zmanjšanje stroškov računalniške obdelave pri izvajanju agentov umetne inteligence (AI) v velikem obsegu.

NAPISAL

Jamie Redman

DELI

Objavljeno: 19. apr. 2026, 23:45

Nvidia je predstavila Nemotron 3 Super, model odprte umetne inteligence z 120 milijardami parametrov, zasnovan za agenske delovne obremenitve

Ključne ugotovitve:

Nvidia je predstavila Nemotron 3 Super, odprti model MoE s 120 milijardami parametrov, ki v vsakem naprednem prehodu aktivira le 12,7 milijarde parametrov.
Nemotron 3 Super zagotavlja do 7,5-krat večjo prepustnost kot Qwen3.5-122B-A10B pri delovnih obremenitvah agentov v nastavitvah 8k-in/64k-out.
Model je v celoti odprt v skladu z licenco Nvidia Nemotron Open Model License, s kontrolnimi točkami in podatki za usposabljanje na Hugging Face.

Nvidia predstavlja Nemotron 3 Super s 7,5-kratno povečano prepustnostjo v primerjavi z Qwen3.5-122B

Najnovejši model Nvidie aktivira le 12,7 milijarde parametrov na posredni prehod z uporabo arhitekture Mixture-of-Experts (MoE), kar pomeni, da večina njegove teže ostane neaktivna med sklepanjem. Ta izbira zasnove neposredno cilja na dva problema, s katerima se razvijalci srečujejo pri uvajanju večstopenjskih AI-agentov: dodatne stroške podaljšanih verig sklepanja in eksplozivno povečanje porabe tokenov, ki se lahko v večagentskih poteh pomnoži do 15-krat.

Nemotron 3 Super je drugi model v družini Nemotron 3 podjetja Nvidia, ki sledi modelu Nemotron 3 Nano iz decembra 2025. Nvidia je izid napovedala okoli 10. marca 2026.

Model uporablja hibridno hrbtenico Mamba-Transformer v 88 slojih. Bloki Mamba-2 obdelujejo dolge zaporedja z učinkovitostjo linearne časa, medtem ko sloji pozornosti Transformer ohranjajo natančen priklic. Ta kombinacija modelu omogoča nativno podporo za kontekstna okna do milijona tokenov brez izgub pomnilnika, ki so značilne za zasnove s čisto pozornostjo.

Nvidia je vgradila tudi usmerjevalni sistem LatentMoE, ki stisne vgrajene tokene v prostor nizkega ranga, preden jih pošlje 512 strokovnjakom na plast, pri čemer aktivira 22 naenkrat. Podjetje pravi, da to omogoča približno štirikrat več strokovnjakov ob enakih stroških sklepanja v primerjavi s standardnimi pristopi MoE ter omogoča natančnejšo specializacijo nalog, kot je ločevanje logike Python od obdelave SQL na strokovni ravni.

Nvidia Releases Nemotron 3 Super, a 120B Open AI Model Built for Agentic Workloads — Vir slike: blog Nvidie.

Sloji za napovedovanje več tokenov, ki uporabljajo dve glavi s skupno težo, pospešijo generiranje verige misli in omogočajo nativno spekulativno dekodiranje. Pri strukturiranih nalogah Nvidia poroča o do trikrat hitrejši generaciji.

Model je bil predhodno usposobljen na 25 bilijonih tokenov v dveh fazah. V prvi fazi je bilo uporabljenih 20 bilijonov tokenov splošnih podatkov. V drugi fazi je bilo uporabljenih pet bilijonov visokokakovostnih tokenov, prilagojenih za primerjalno zmogljivost. Končna razširitvena faza na 51 milijardah tokenov je razširila nativni kontekst na milijon tokenov. Po usposabljanju je bilo izvedeno nadzorovano natančno prilagajanje na približno sedmih milijonih vzorcev in učenje s krepitvijo v 21 okoljih z več kot 1,2 milijona izvedb.

V primerjalnih testih je Nemotron 3 Super dosegel 83,73 točk na MMLU-Pro, 90,21 na AIME25 in 60,47 na SWE-Bench z uporabo OpenHands. Na PinchBench je dosegel 85,6 odstotka, kar je najvišji zabeležen rezultat med odprtimi modeli v svojem razredu. Pri ocenjevanju dolgih kontekstov je dosegel 91,64 točk na RULER 1M.

V primerjavi z GPT-OSS-120B Nemotron 3 Super zagotavlja 2,2-krat večjo prepustnost pri 8k vhodnih in 64k izhodnih podatkih. V primerjavi z Qwen3.5-122B-A10B ta številka doseže 7,5-kratno vrednost. Nvidia poroča tudi o več kot petkratni prepustnosti in do dvakratni natančnosti v primerjavi s prejšnjo generacijo Nemotron Super.
Nvidia je model usposobila od začetka do konca v svojem štiribitnem formatu s plavajočo vejico NVFP4, optimiziranem za grafične procesorje Blackwell. Na stroju B200 Nvidia navaja, da sklepanje poteka do štirikrat hitreje v primerjavi z FP8 na H100, pri čemer ni poročanih izgub natančnosti. Kvantizirani kontrolni točki FP8 in NVFP4 ohranjajo 99,8 odstotka ali več natančnosti s polno natančnostjo.

Model poganja tudi raziskovalnega agenta Nvidia AI-Q, ki je dosegel prvo mesto na lestvici Deepresearch Bench.

Nvidia podpira načrte podjetja Nebius AI Factory z ogromno naložbo v višini 2 milijard dolarjev

Preberite, kako podjetje Nvidia s 2-milijardno naložbo v infrastrukturo umetne inteligence v oblaku preoblikuje prihodnost računalništva. read more.

Nvidia podpira načrte podjetja Nebius AI Factory z ogromno naložbo v višini 2 milijard dolarjev

Preberite, kako podjetje Nvidia s 2-milijardno naložbo v infrastrukturo umetne inteligence v oblaku preoblikuje prihodnost računalništva. read more.

Nvidia podpira načrte podjetja Nebius AI Factory z ogromno naložbo v višini 2 milijard dolarjev

Preberite, kako podjetje Nvidia s 2-milijardno naložbo v infrastrukturo umetne inteligence v oblaku preoblikuje prihodnost računalništva. read more.

Nemotron 3 Super je v celoti odprt pod licenco Nvidia Nemotron Open Model License. Kontrolne točke v formatih BF16, FP8 in NVFP4, skupaj s podatki za predhodno usposabljanje, vzorci po usposabljanju in okolji za učenje s krepitvijo, so na voljo na Hugging Face. Sklepanje je podprto prek Nvidia NIM, build.nvidia.com, Perplexity, Openrouter, Together AI, Google Cloud, AWS, Azure in Coreweave, z možnostmi na lokaciji prek Dell Enterprise Hub in HPE.

Razvijalci lahko dostopajo do receptov za usposabljanje, vodnikov za natančno nastavitev in priročnikov za sklepanje prek platforme NeMo z uporabo vLLM, SGLang in TensorRT-LLM.

Poročilo Keyrock: 76 % transakcij, ki jih opravijo AI-agenti, ne dosega najnižje provizije Visa v višini 0,30 USD

24. maj 2026

Poročilo: Strateški analitik pri Goldman Sachs pravi, da bodo strahovi pred pretresi zaradi umetne inteligence še leta vplivali na delnice podjetij za programsko opremo

News

7. apr. 2026

Zvezda filma »Resident Evil« Milla Jovovich skupaj z inženirjem Benom Sigmanom razvija orodje za shranjevanje podatkov z umetno inteligenco

News

5. apr. 2026

Članek podjetja Deepmind z naslovom »AI Agent Traps« opisuje, kako bi hekerji lahko izkoristili agente umetne inteligence proti uporabnikom

News

Oznake v tem članku

Artificial intelligence (AI)Nvidia

NAJNOVEJŠE NOVICE

Sosnick opozarja, da »turisti« na trgu kriptovalut izplačujejo sredstva, medtem ko so ETF-ji na bitcoine izgubili 1,42 milijarde dolarjev

pred 27 minutami

Indeks S&P 500 se je ob koncu trgovanja ustavil na rekordnih 7.599 točkah, saj so delnice prehitele zaostajajoči bitcoin

pred 57 minutami

Nekdanjemu branilcu Miami Heata Terryju Rozierju so vložili zvezne obtožbe zaradi podkupovanja v zvezi z domnevnim podkupnim plačilom v višini 100.000 dolarjev

pred 1 uro

Citi napoveduje, da bo do leta 2030 trg tokeniziranih sredstev dosegel vrednost 5,5 bilijona dolarjev, medtem ko se Wall Street seli na blokovno verigo

pred 3 urami

Solana se pripravlja na obsežno prenovo tokenomike, da bi zmanjšala inflacijo v omrežju

pred 4 urami

Nvidia je predstavila Nemotron 3 Super, model odprte umetne inteligence z 120 milijardami parametrov, zasnovan za agenske delovne obremenitve

Nvidia predstavlja Nemotron 3 Super s 7,5-kratno povečano prepustnostjo v primerjavi z Qwen3.5-122B

Nvidia podpira načrte podjetja Nebius AI Factory z ogromno naložbo v višini 2 milijard dolarjev

Nvidia podpira načrte podjetja Nebius AI Factory z ogromno naložbo v višini 2 milijard dolarjev

Nvidia podpira načrte podjetja Nebius AI Factory z ogromno naložbo v višini 2 milijard dolarjev

Povezani članki

Poročilo Keyrock: 76 % transakcij, ki jih opravijo AI-agenti, ne dosega najnižje provizije Visa v višini 0,30 USD

Podjetje Anthropic predstavlja Claude Opus 4.7, saj so v ospredju agencijski delovni tokovi

Crossmintov Lobster.cash vključuje Mastercard Agent Pay za agencijsko trgovanje

Poročilo: Strateški analitik pri Goldman Sachs pravi, da bodo strahovi pred pretresi zaradi umetne inteligence še leta vplivali na delnice podjetij za programsko opremo

Zvezda filma »Resident Evil« Milla Jovovich skupaj z inženirjem Benom Sigmanom razvija orodje za shranjevanje podatkov z umetno inteligenco

Članek podjetja Deepmind z naslovom »AI Agent Traps« opisuje, kako bi hekerji lahko izkoristili agente umetne inteligence proti uporabnikom

Oznake v tem članku

NAJNOVEJŠE NOVICE

Sosnick opozarja, da »turisti« na trgu kriptovalut izplačujejo sredstva, medtem ko so ETF-ji na bitcoine izgubili 1,42 milijarde dolarjev

Indeks S&P 500 se je ob koncu trgovanja ustavil na rekordnih 7.599 točkah, saj so delnice prehitele zaostajajoči bitcoin

Nekdanjemu branilcu Miami Heata Terryju Rozierju so vložili zvezne obtožbe zaradi podkupovanja v zvezi z domnevnim podkupnim plačilom v višini 100.000 dolarjev

Citi napoveduje, da bo do leta 2030 trg tokeniziranih sredstev dosegel vrednost 5,5 bilijona dolarjev, medtem ko se Wall Street seli na blokovno verigo

Solana se pripravlja na obsežno prenovo tokenomike, da bi zmanjšala inflacijo v omrežju

NAJNOVEJŠE NOVICE

Sosnick opozarja, da »turisti« na trgu kriptovalut izplačujejo sredstva, medtem ko so ETF-ji na bitcoine izgubili 1,42 milijarde dolarjev

Indeks S&P 500 se je ob koncu trgovanja ustavil na rekordnih 7.599 točkah, saj so delnice prehitele zaostajajoči bitcoin

Nekdanjemu branilcu Miami Heata Terryju Rozierju so vložili zvezne obtožbe zaradi podkupovanja v zvezi z domnevnim podkupnim plačilom v višini 100.000 dolarjev

Citi napoveduje, da bo do leta 2030 trg tokeniziranih sredstev dosegel vrednost 5,5 bilijona dolarjev, medtem ko se Wall Street seli na blokovno verigo

Solana se pripravlja na obsežno prenovo tokenomike, da bi zmanjšala inflacijo v omrežju

NAJNOVEJŠE NOVICE

Sosnick opozarja, da »turisti« na trgu kriptovalut izplačujejo sredstva, medtem ko so ETF-ji na bitcoine izgubili 1,42 milijarde dolarjev

Indeks S&P 500 se je ob koncu trgovanja ustavil na rekordnih 7.599 točkah, saj so delnice prehitele zaostajajoči bitcoin

Nekdanjemu branilcu Miami Heata Terryju Rozierju so vložili zvezne obtožbe zaradi podkupovanja v zvezi z domnevnim podkupnim plačilom v višini 100.000 dolarjev

Citi napoveduje, da bo do leta 2030 trg tokeniziranih sredstev dosegel vrednost 5,5 bilijona dolarjev, medtem ko se Wall Street seli na blokovno verigo

Solana se pripravlja na obsežno prenovo tokenomike, da bi zmanjšala inflacijo v omrežju

SPOROČILA ZA JAVNOST

OKX je na trg uvedel večne terminske pogodbe TRXUSD (X-Perp) in s tem omogočil dostop do izvedenih finančnih instrumentov za TRX, ki so skladni z direktivo MiFID

Kriptovalute na Wall Streetu: MEXC predstavlja »RealStocks« z brezplačnim trgovanjem z ameriškimi delnicami in resničnimi dividendami

Osvojite vrhunsko doživetje gostoljubnosti na svetovnem prvenstvu! ZOOMEX World Cup Carnival se začenja z nagradnim skladom v višini 300.000 dolarjev

Kiti iz omrežij Hyperliquid in Zcash se množično udeležujejo predprodaje SurgeXRP, saj je že zbranih več kot 10 % mehkega limita; kmalu bo objavljena lestvica najboljših

BC.GAME: Udeleženci programa BC Engine so zaslužili več kot 2 milijona dolarjev nagrad

Povezani članki

Poročilo Keyrock: 76 % transakcij, ki jih opravijo AI-agenti, ne dosega najnižje provizije Visa v višini 0,30 USD

Podjetje Anthropic predstavlja Claude Opus 4.7, saj so v ospredju agencijski delovni tokovi

Crossmintov Lobster.cash vključuje Mastercard Agent Pay za agencijsko trgovanje

Poročilo: Strateški analitik pri Goldman Sachs pravi, da bodo strahovi pred pretresi zaradi umetne inteligence še leta vplivali na delnice podjetij za programsko opremo

Zvezda filma »Resident Evil« Milla Jovovich skupaj z inženirjem Benom Sigmanom razvija orodje za shranjevanje podatkov z umetno inteligenco

Članek podjetja Deepmind z naslovom »AI Agent Traps« opisuje, kako bi hekerji lahko izkoristili agente umetne inteligence proti uporabnikom