NewsMegjelent:2026. ápr. 19. 23:45

Az Nvidia bemutatja a Nemotron 3 Supert, egy 120 milliárd paraméteres OpenAI-modellt, amelyet ügynökalapú feladatokra fejlesztettek ki

Az Nvidia kiadta a Nemotron 3 Super modellt, egy összesen 120 milliárd paraméterrel rendelkező, nyílt hibrid modellt, amelyet úgy terveztek, hogy csökkentsék a mesterséges intelligencia (AI) ügynökök nagy léptékű futtatásának számítási költségeit.

ÍRTA

Jamie Redman

MEGOSZTÁS

Megjelent: 2026. ápr. 19. 23:45

Az Nvidia bemutatja a Nemotron 3 Supert, egy 120 milliárd paraméteres OpenAI-modellt, amelyet ügynökalapú feladatokra fejlesztettek ki

Főbb megállapítások:

Az Nvidia kiadta a Nemotron 3 Super-t, egy 120 milliárd paraméteres nyílt MoE modellt, amely előremeneti ciklusonként csak 12,7 milliárd paramétert aktivál.
A Nemotron 3 Super akár 7,5-szer nagyobb átviteli sebességet biztosít, mint a Qwen3.5-122B-A10B az ügynökök terhelései esetén 8k-in/64k-out beállítások mellett.
A modell teljes mértékben nyílt az Nvidia Nemotron Open Model License alapján, a checkpointok és a képzési adatok a Hugging Face-en találhatók.

Az Nvidia piacra dobja a Nemotron 3 Super modellt, amely 7,5-szer nagyobb átviteli sebességet biztosít a Qwen3.5-122B-hez képest

A legújabb Nvidia-modell a Mixture-of-Experts (MoE) architektúra használatával előremeneti lépésenként csak 12,7 milliárd paramétert aktivál, ami azt jelenti, hogy súlyának nagy része inaktív marad a következtetés során. Ez a tervezési döntés közvetlenül két olyan problémát céloz meg, amellyel a fejlesztők szembesülnek a több lépéses AI-ügynökök telepítésekor: a kiterjesztett érvelési láncok hozzáadott költségeit és a tokenhasználat robbanásszerű növekedését, amely többszereplős folyamatokban akár 15-szeresére is megnőhet.

A Nemotron 3 Super az Nvidia Nemotron 3 családjának második modellje, a 2025 decemberében megjelent Nemotron 3 Nano után. Az Nvidia 2026. március 10. körül jelentette be a kiadást.

A modell 88 rétegen átívelő hibrid Mamba-Transformer gerincet használ. A Mamba-2 blokkok lineáris időhatékonysággal kezelik a hosszú szekvenciákat, míg a Transformer figyelemrétegek megőrzik a pontos visszahívást. Ez a kombináció natív támogatást biztosít a modellnek akár egymillió tokenes kontextusablakokhoz is, anélkül, hogy a tisztán figyelemalapú tervezésekre jellemző memória-terhelés jelentkezne.

Az Nvidia beépített egy LatentMoE útválasztó rendszert is, amely a token-beágyazásokat alacsony rangú térbe tömöríti, mielőtt azokat rétegenként 512 szakértőnek továbbítaná, egyszerre 22-t aktiválva. A vállalat szerint ez a standard MoE-megközelítésekhez képest körülbelül négyszer több szakértőt tesz lehetővé azonos következtetési költség mellett, és finomabb feladat-specializációt tesz lehetővé, például a Python-logika és az SQL-kezelés szakértői szintű szétválasztását.

Nvidia Releases Nemotron 3 Super, a 120B Open AI Model Built for Agentic Workloads — Kép forrása: Nvidia blog.

A két közös súlyú fejjel rendelkező Multi-Token Prediction rétegek felgyorsítják a gondolatlánc-generálást és lehetővé teszik a natív spekulatív dekódolást. Strukturált feladatok esetén az Nvidia akár háromszor gyorsabb generálást jelent.

A modellt két fázisban, 25 billió tokenen előre betanították. Az első fázisban 20 billió tokennyi széles körű adatot használtak. A másodikban 5 billió, a benchmark teljesítményre hangolt, kiváló minőségű tokenet használtak. Egy végső kiterjesztési fázis 51 milliárd tokenen kiterjesztette a natív kontextust egymillió tokenre. A betanítás utáni fázis magában foglalta a felügyelt finomhangolást körülbelül hétmillió mintán, valamint a megerősítő tanulást 21 környezetben, több mint 1,2 millió rollouttal.

A benchmark tesztekben a Nemotron 3 Super 83,73 pontot ért el az MMLU-Pro-n, 90,21-et az AIME25-ön, és 60,47-et az SWE-Bench-en az OpenHands használatával. A PinchBench-en 85,6 százalékot ért el, ami a legmagasabb jelentett pontszám a kategóriájában lévő nyílt modellek között. Hosszú kontextusú értékelés során 91,64 pontot ért el a RULER 1M-en.

A GPT-OSS-120B-hez képest a Nemotron 3 Super 2,2-szeres átviteli sebességet biztosít 8k bemenet és 64k kimenet esetén. A Qwen3.5-122B-A10B-hez viszonyítva ez az arány 7,5-szeresre nő. Az Nvidia arról is beszámol, hogy az előző Nemotron Super generációhoz képest több mint ötszörös átviteli sebességet és akár kétszeres pontosságot ér el.
Az Nvidia a modellt végpontok közötti módon, a Blackwell GPU-kra optimalizált NVFP4 négybites lebegőpontos formátumban képezte ki. A B200 hardveren az Nvidia szerint a következtetés akár négyszer gyorsabban fut, mint az H100-on az FP8, anélkül, hogy pontossági veszteséget jelentettek volna. A kvantált FP8 és NVFP4 ellenőrzőpontok a teljes pontosság 99,8 százalékát vagy annál többet megőrzik.

A modell az Nvidia AI-Q kutatási ügynököt is működteti, amely az első helyet érte el a Deepresearch Bench ranglistáján.

Az Nvidia 2 milliárd dolláros hatalmas beruházással támogatja a Nebius AI gyárépítési terveit

Fedezze fel, hogyan alakítja át az Nvidia a számítástechnika jövőjét egy 2 milliárd dolláros beruházással a mesterséges intelligencia felhőalapú infrastruktúrájába. read more.

Az Nvidia 2 milliárd dolláros hatalmas beruházással támogatja a Nebius AI gyárépítési terveit

Fedezze fel, hogyan alakítja át az Nvidia a számítástechnika jövőjét egy 2 milliárd dolláros beruházással a mesterséges intelligencia felhőalapú infrastruktúrájába. read more.

Az Nvidia 2 milliárd dolláros hatalmas beruházással támogatja a Nebius AI gyárépítési terveit

Fedezze fel, hogyan alakítja át az Nvidia a számítástechnika jövőjét egy 2 milliárd dolláros beruházással a mesterséges intelligencia felhőalapú infrastruktúrájába. read more.

A Nemotron 3 Super teljes mértékben nyílt a Nvidia Nemotron Open Model License alapján. A BF16, FP8 és NVFP4 formátumú ellenőrzőpontok, valamint az előzetes képzési adatok, a képzés utáni minták és a megerősítő tanulási környezetek elérhetők a Hugging Face-en. Az inferenciát az Nvidia NIM, a build.nvidia.com, a Perplexity, az Openrouter, a Together AI, a Google Cloud, az AWS, az Azure és a Coreweave támogatja, helyszíni opciókkal a Dell Enterprise Hub és a HPE révén.

A fejlesztők a NeMo platformon keresztül vLLM, SGLang és TensorRT-LLM használatával érhetik el a képzési receptjeiket, a finomhangolási útmutatókat és az inferencia-szakácskönyveket.

Keyrock-jelentés: Az AI-ügynökök által lebonyolított tranzakciók 76%-a nem éri el a Visa 0,30 dolláros díjküszöbét

2026. máj. 24.

Jelentés: A Goldman Sachs stratégája szerint a mesterséges intelligencia okozta zavaroktól való félelem még évekig kísérni fogja a szoftveripari részvényeket

News

2026. ápr. 7.

A Resident Evil sztárja, Milla Jovovich mesterséges intelligencia-alapú memóriakészítő eszközt fejleszt Ben Sigman mérnökkel

News

2026. ápr. 5.

A Deepmind „AI Agent Traps” című tanulmánya bemutatja, hogyan használhatják a hackerek az AI-ügynököket a felhasználók ellen

News

Címkék ebben a cikkben

Artificial intelligence (AI)Nvidia

LEGFRISSEBB HÍREK

Az STRC stratégia 11,5%-os hozamot biztosít a Farmer's Fathernek, a kritikusok szerint ez egy „bitcoin-csalás”

1 órája

A 10 legfontosabb jelzés, amelyet a kereskedők figyelnek, miközben a bitcoin, a részvények és a Fed meghatározzák a júniusi hangulatot

2 órája

Az XRP a 2026. első negyedévi rangsorban a BNB mögé szorult, de az új intézményi adatok emelkedő tendenciát jeleznek

3 órája

2000 dolláros csatatér: az Ethereum 32%-ot veszít 2026-ban, míg a BTC viszonylag stabil marad

5 órája

A bitcoin határidős ügyletek értéke 11 tőzsdén összesen 42,6 milliárd dollárt ért el – íme, mit jelez a nyitott pozíciók állománya júniusra nézve

6 órája

Az Nvidia bemutatja a Nemotron 3 Supert, egy 120 milliárd paraméteres OpenAI-modellt, amelyet ügynökalapú feladatokra fejlesztettek ki

Az Nvidia piacra dobja a Nemotron 3 Super modellt, amely 7,5-szer nagyobb átviteli sebességet biztosít a Qwen3.5-122B-hez képest

Az Nvidia 2 milliárd dolláros hatalmas beruházással támogatja a Nebius AI gyárépítési terveit

Az Nvidia 2 milliárd dolláros hatalmas beruházással támogatja a Nebius AI gyárépítési terveit

Az Nvidia 2 milliárd dolláros hatalmas beruházással támogatja a Nebius AI gyárépítési terveit

Kapcsolódó cikkek

Keyrock-jelentés: Az AI-ügynökök által lebonyolított tranzakciók 76%-a nem éri el a Visa 0,30 dolláros díjküszöbét

Az Anthropic bemutatja a Claude Opus 4.7-et, miközben az agentikus munkafolyamatok kerülnek a középpontba

A Crossmint Lobster.cash szolgáltatása integrálja a Mastercard Agent Pay rendszert az ügynöki kereskedelem támogatására

Jelentés: A Goldman Sachs stratégája szerint a mesterséges intelligencia okozta zavaroktól való félelem még évekig kísérni fogja a szoftveripari részvényeket

A Resident Evil sztárja, Milla Jovovich mesterséges intelligencia-alapú memóriakészítő eszközt fejleszt Ben Sigman mérnökkel

A Deepmind „AI Agent Traps” című tanulmánya bemutatja, hogyan használhatják a hackerek az AI-ügynököket a felhasználók ellen

Címkék ebben a cikkben

LEGFRISSEBB HÍREK

Az STRC stratégia 11,5%-os hozamot biztosít a Farmer's Fathernek, a kritikusok szerint ez egy „bitcoin-csalás”

A 10 legfontosabb jelzés, amelyet a kereskedők figyelnek, miközben a bitcoin, a részvények és a Fed meghatározzák a júniusi hangulatot

Az XRP a 2026. első negyedévi rangsorban a BNB mögé szorult, de az új intézményi adatok emelkedő tendenciát jeleznek

2000 dolláros csatatér: az Ethereum 32%-ot veszít 2026-ban, míg a BTC viszonylag stabil marad

A bitcoin határidős ügyletek értéke 11 tőzsdén összesen 42,6 milliárd dollárt ért el – íme, mit jelez a nyitott pozíciók állománya júniusra nézve

LEGFRISSEBB HÍREK

Az STRC stratégia 11,5%-os hozamot biztosít a Farmer's Fathernek, a kritikusok szerint ez egy „bitcoin-csalás”

A 10 legfontosabb jelzés, amelyet a kereskedők figyelnek, miközben a bitcoin, a részvények és a Fed meghatározzák a júniusi hangulatot

Az XRP a 2026. első negyedévi rangsorban a BNB mögé szorult, de az új intézményi adatok emelkedő tendenciát jeleznek

2000 dolláros csatatér: az Ethereum 32%-ot veszít 2026-ban, míg a BTC viszonylag stabil marad

A bitcoin határidős ügyletek értéke 11 tőzsdén összesen 42,6 milliárd dollárt ért el – íme, mit jelez a nyitott pozíciók állománya júniusra nézve

LEGFRISSEBB HÍREK

Az STRC stratégia 11,5%-os hozamot biztosít a Farmer's Fathernek, a kritikusok szerint ez egy „bitcoin-csalás”

A 10 legfontosabb jelzés, amelyet a kereskedők figyelnek, miközben a bitcoin, a részvények és a Fed meghatározzák a júniusi hangulatot

Az XRP a 2026. első negyedévi rangsorban a BNB mögé szorult, de az új intézményi adatok emelkedő tendenciát jeleznek

2000 dolláros csatatér: az Ethereum 32%-ot veszít 2026-ban, míg a BTC viszonylag stabil marad

A bitcoin határidős ügyletek értéke 11 tőzsdén összesen 42,6 milliárd dollárt ért el – íme, mit jelez a nyitott pozíciók állománya júniusra nézve

SAJTÓKÖZLEMÉNYEK

BC.GAME: A BC Engine résztvevői több mint 2 millió dollár jutalmat szereztek

A Falcon Finance és az Anchorage Digital Bank elindítja az fUSD-t, egy GENIUS-kompatibilis stabilcoin-t, amely jutalmakat kínál a Ceffu platformon

A SODAX és a Bound lehetővé teszi a natív bitcoin kereskedését 18 hálózaton át, csomagolás nélkül

HTX jótékonysági akció: melegség és törődés a pakisztáni gyermekeknek a Bitcoin Pizza Napon

A Rain 100 millió dollárnyi likviditást biztosít a V2 bevezetése és a világbajnokságra való kiterjesztés előtt, ezzel a TVL-érték alapján a világ harmadik legnagyobb jóslatpiacává válik

Kapcsolódó cikkek

Keyrock-jelentés: Az AI-ügynökök által lebonyolított tranzakciók 76%-a nem éri el a Visa 0,30 dolláros díjküszöbét

Az Anthropic bemutatja a Claude Opus 4.7-et, miközben az agentikus munkafolyamatok kerülnek a középpontba

A Crossmint Lobster.cash szolgáltatása integrálja a Mastercard Agent Pay rendszert az ügynöki kereskedelem támogatására

Jelentés: A Goldman Sachs stratégája szerint a mesterséges intelligencia okozta zavaroktól való félelem még évekig kísérni fogja a szoftveripari részvényeket

A Resident Evil sztárja, Milla Jovovich mesterséges intelligencia-alapú memóriakészítő eszközt fejleszt Ben Sigman mérnökkel

A Deepmind „AI Agent Traps” című tanulmánya bemutatja, hogyan használhatják a hackerek az AI-ügynököket a felhasználók ellen