NewsJulkaistu:19.4.2026 klo 23.45

Nvidia julkaisee Nemotron 3 Superin, 120 miljardin parametrin OpenAI-mallin, joka on suunniteltu agenttipohjaisiin työkuormiin

Nvidia on julkaissut Nemotron 3 Superin, avoimen hybridimallin, jonka parametrien kokonaismäärä on 120 miljardia ja joka on suunniteltu vähentämään tekoälyagenttien laajamittaisen käytön laskentakustannuksia.

KIRJOITTAJA

Jamie Redman

JAA

Julkaistu: 19.4.2026 klo 23.45

Nvidia julkaisee Nemotron 3 Superin, 120 miljardin parametrin OpenAI-mallin, joka on suunniteltu agenttipohjaisiin työkuormiin

Tärkeimmät kohdat:

Nvidia julkaisi Nemotron 3 Superin, 120 miljardin parametrin avoimen MoE-mallin, joka aktivoi vain 12,7 miljardia parametria per eteenpäinlähetys.
Nemotron 3 Super tarjoaa jopa 7,5-kertaisen suorituskyvyn Qwen3.5-122B-A10B:hen verrattuna agenttien työkuormissa 8k-in/64k-out-asetuksilla.
Malli on täysin avoin Nvidia Nemotron Open Model -lisenssin alaisena, ja sen tarkistuspisteet ja koulutustiedot ovat saatavilla Hugging Facessa.

Nvidia lanseeraa Nemotron 3 Superin, jonka suorituskyky on 7,5-kertainen Qwen3.5-122B:hen verrattuna

Uusin Nvidia-malli aktivoi vain 12,7 miljardia parametria per eteenpäinohjaus käyttämällä Mixture-of-Experts (MoE) -arkkitehtuuria, mikä tarkoittaa, että suurin osa sen painoarvosta pysyy käyttämättömänä päättelyn aikana. Tämä suunnitteluratkaisu kohdistuu suoraan kahteen ongelmaan, joihin kehittäjät törmäävät ottaessaan käyttöön monivaiheisia tekoälyagentteja: laajennettujen päättelyketjujen aiheuttamiin lisäkustannuksiin ja tokenien käytön räjähdysmäiseen kasvuun, joka voi moninkertaistua jopa 15-kertaiseksi moniagenttiputkistoissa.

Nemotron 3 Super on Nvidian Nemotron 3 -tuoteperheen toinen malli joulukuussa 2025 julkaistun Nemotron 3 Nanon jälkeen. Nvidia ilmoitti julkaisusta noin 10. maaliskuuta 2026.

Malli käyttää hybridi-Mamba-Transformer-runkoa 88 kerroksessa. Mamba-2-lohkot käsittelevät pitkiä sekvenssejä lineaarisella tehokkuudella, kun taas Transformer-huomiokerrokset säilyttävät tarkan palautuksen. Tämä yhdistelmä antaa mallille natiivin tuen jopa miljoonan tokenin konteksti-ikkunoille ilman puhdas-huomio-suunnittelulle tyypillisiä muistihaittoja.

Nvidia on myös rakentanut LatentMoE-reititysjärjestelmän, joka pakkaa token-upotukset matalan asteen tilaan ennen niiden lähettämistä 512 asiantuntijalle kerrosta kohti, aktivoiden 22 kerrallaan. Yrityksen mukaan tämä mahdollistaa noin neljä kertaa enemmän asiantuntijoita samalla päättelykustannuksella verrattuna tavallisiin MoE-lähestymistapoihin ja mahdollistaa tarkemman tehtävien erikoistumisen, kuten Python-logiikan erottamisen SQL-käsittelystä asiantuntijatasolla.

Nvidia Releases Nemotron 3 Super, a 120B Open AI Model Built for Agentic Workloads — Kuvan lähde: Nvidian blogi.

Multi-Token Prediction -kerrokset, jotka käyttävät kahta jaettua painopäätä, nopeuttavat ajatusketjun luomista ja mahdollistavat natiivin spekulatiivisen dekoodauksen. Rakenteellisissa tehtävissä Nvidia raportoi jopa kolminkertaisen nopeuden.

Malli esikoulutettiin 25 biljoonalla tokenilla kahdessa vaiheessa. Ensimmäisessä vaiheessa käytettiin 20 biljoonaa tokenia laajaa dataa. Toisessa vaiheessa käytettiin viittä biljoonaa korkealaatuista tokenia, jotka oli viritetty vertailuarvosuorituskykyä varten. Lopullinen laajennusvaihe 51 miljardilla tokenilla laajensi natiivin kontekstin miljoonaan tokeniin. Koulutuksen jälkeiseen vaiheeseen sisältyi valvotun hienosäätö noin seitsemällä miljoonalla näytteellä sekä vahvistusoppiminen 21 ympäristössä yli 1,2 miljoonalla käyttöönotolla.

Vertailuissa Nemotron 3 Super sai 83,73 pistettä MMLU-Pro:ssa, 90,21 pistettä AIME25:ssä ja 60,47 pistettä SWE-Benchissä OpenHandsia käyttäen. PinchBenchissä se saavutti 85,6 prosenttia, mikä on korkein raportoitu tulos luokkansa avoimista malleista. Pitkän kontekstin arvioinnissa se sai 91,64 pistettä RULER 1M:ssä.

Verrattuna GPT-OSS-120B:hen Nemotron 3 Super tarjoaa 2,2-kertaisen läpimenon 8k:n syötöllä ja 64k:n tuotoksella. Verrattuna Qwen3.5-122B-A10B:hen luku nousee 7,5-kertaiseksi. Nvidia raportoi myös yli viisinkertaisen läpimenon ja jopa kaksinkertaisen tarkkuuden edelliseen Nemotron Super -sukupolveen verrattuna.

Nvidia koulutti mallin päästä päähän NVFP4-nelibittisessä liukulukuformaatissaan, joka on optimoitu Blackwell-grafiikkaprosessoreille. Nvidia kertoo, että B200-laitteistolla päättely on jopa neljä kertaa nopeampaa verrattuna H100:n FP8:aan ilman raportoituja tarkkuuden menetyksiä. Kvantisoidut FP8- ja NVFP4-tarkistuspisteet säilyttävät 99,8 prosenttia tai enemmän täyden tarkkuuden tarkkuudesta.

Malli ohjaa myös Nvidia AI-Q -tutkimusagenttia, joka saavutti ykkössijan Deepresearch Bench -tulostaululla.

Nvidia tukee Nebiusin tekoälytehtaan suunnitelmia 2 miljardin dollarin jättisijoituksella

Tutustu siihen, miten Nvidia muokkaa tietotekniikan tulevaisuutta 2 miljardin dollarin investoinnilla tekoälyn pilvi-infrastruktuuriin. read more.

Nvidia tukee Nebiusin tekoälytehtaan suunnitelmia 2 miljardin dollarin jättisijoituksella

Tutustu siihen, miten Nvidia muokkaa tietotekniikan tulevaisuutta 2 miljardin dollarin investoinnilla tekoälyn pilvi-infrastruktuuriin. read more.

Nvidia tukee Nebiusin tekoälytehtaan suunnitelmia 2 miljardin dollarin jättisijoituksella

Tutustu siihen, miten Nvidia muokkaa tietotekniikan tulevaisuutta 2 miljardin dollarin investoinnilla tekoälyn pilvi-infrastruktuuriin. read more.

Nemotron 3 Super on täysin avoin Nvidia Nemotron Open Model -lisenssin alaisena. BF16-, FP8- ja NVFP4-muotoiset tarkistuspisteet sekä esikoulutustiedot, jälkikoulutusnäytteet ja vahvistusoppimisympäristöt ovat saatavilla Hugging Facessa. Päätelmien tekemistä tuetaan Nvidia NIM:n, build.nvidia.comin, Perplexityn, Openrouterin, Together AI:n, Google Cloudin, AWS:n, Azuren ja Coreweaven kautta, ja paikallisia vaihtoehtoja on saatavilla Dell Enterprise Hubin ja HPE:n kautta.

Kehittäjät voivat käyttää koulutusohjeita, hienosäätöoppaita ja päätelmien tekemisen oppaita NeMo-alustan kautta käyttämällä vLLM:ää, SGLangia ja TensorRT-LLM:ää.

24.5.2026

Keyrockin raportti: 76 % tekoälypohjaisten maksutapahtumien käsittelymaksut jäävät alle Visan 0,30 dollarin vähimmäismaksurajan

News

17.4.2026

Anthropic esittelee Claude Opus 4.7:n, kun agenttipohjaiset työnkulut nousevat keskiöön

News

16.4.2026

Crossmintin Lobster.cash-palvelu integroi Mastercard Agent Pay -ratkaisun agenttipohjaiseen kaupankäyntiin

News

13.4.2026

Raportti: Goldman Sachsin strategin mukaan tekoälyn aiheuttamaa mullistusta koskevat pelot vaivaavat ohjelmistoalan osakkeita vielä vuosia

News

7.4.2026

Resident Evil -elokuvan tähti Milla Jovovich kehittää tekoälypohjaista muistityökalua yhdessä insinööri Ben Sigmanin kanssa

News

5.4.2026

Deepmindin tutkimusartikkeli ”AI Agent Traps” kuvaa, miten hakkerit voisivat käyttää tekoälyagentteja käyttäjiä vastaan

News

Tunnisteet tässä tarinassa

Artificial intelligence (AI)Nvidia

VIIMEISIMMÄT UUTISET

Altcoin-kausindeksi on 49 — kauppiaat tarvitsevat bitcoinin markkinaosuuden laskevan alle 55 prosenttiin, jotta siirtymä käynnistyy

11 minuuttia sitten

Cryptoquant: Jokaisen bitcoinin pohjan takana oleva on-chain-raja on lähellä 40 prosenttia, mikä ei vielä riitä ”maksimaaliseen mahdollisuuteen”

56 minuuttia sitten

Moonpay yhdistää rahoituslaitokset Franklin Templetonin tokenisoituihin rahastoihin osana uutta ketjupohjaista hanketta

Nvidia julkaisee Nemotron 3 Superin, 120 miljardin parametrin OpenAI-mallin, joka on suunniteltu agenttipohjaisiin työkuormiin

Nvidia lanseeraa Nemotron 3 Superin, jonka suorituskyky on 7,5-kertainen Qwen3.5-122B:hen verrattuna

Nvidia tukee Nebiusin tekoälytehtaan suunnitelmia 2 miljardin dollarin jättisijoituksella

Nvidia tukee Nebiusin tekoälytehtaan suunnitelmia 2 miljardin dollarin jättisijoituksella

Nvidia tukee Nebiusin tekoälytehtaan suunnitelmia 2 miljardin dollarin jättisijoituksella

Aiheeseen liittyvät

Keyrockin raportti: 76 % tekoälypohjaisten maksutapahtumien käsittelymaksut jäävät alle Visan 0,30 dollarin vähimmäismaksurajan

Anthropic esittelee Claude Opus 4.7:n, kun agenttipohjaiset työnkulut nousevat keskiöön

Crossmintin Lobster.cash-palvelu integroi Mastercard Agent Pay -ratkaisun agenttipohjaiseen kaupankäyntiin

Raportti: Goldman Sachsin strategin mukaan tekoälyn aiheuttamaa mullistusta koskevat pelot vaivaavat ohjelmistoalan osakkeita vielä vuosia

Resident Evil -elokuvan tähti Milla Jovovich kehittää tekoälypohjaista muistityökalua yhdessä insinööri Ben Sigmanin kanssa

Deepmindin tutkimusartikkeli ”AI Agent Traps” kuvaa, miten hakkerit voisivat käyttää tekoälyagentteja käyttäjiä vastaan

Tunnisteet tässä tarinassa

VIIMEISIMMÄT UUTISET

Altcoin-kausindeksi on 49 — kauppiaat tarvitsevat bitcoinin markkinaosuuden laskevan alle 55 prosenttiin, jotta siirtymä käynnistyy

Cryptoquant: Jokaisen bitcoinin pohjan takana oleva on-chain-raja on lähellä 40 prosenttia, mikä ei vielä riitä ”maksimaaliseen mahdollisuuteen”

Moonpay yhdistää rahoituslaitokset Franklin Templetonin tokenisoituihin rahastoihin osana uutta ketjupohjaista hanketta

”Tuomaristo teki virheen”: Citronin Andrew Left tuomittu arvopaperipetoksesta

Strive ostaa 2 500 bitcoinia, omistukset nousevat 19 000 bitcoiniin 4,2 miljardin dollarin rahoitussuunnitelman edetessä

VIIMEISIMMÄT UUTISET

Altcoin-kausindeksi on 49 — kauppiaat tarvitsevat bitcoinin markkinaosuuden laskevan alle 55 prosenttiin, jotta siirtymä käynnistyy

Cryptoquant: Jokaisen bitcoinin pohjan takana oleva on-chain-raja on lähellä 40 prosenttia, mikä ei vielä riitä ”maksimaaliseen mahdollisuuteen”

Moonpay yhdistää rahoituslaitokset Franklin Templetonin tokenisoituihin rahastoihin osana uutta ketjupohjaista hanketta

”Tuomaristo teki virheen”: Citronin Andrew Left tuomittu arvopaperipetoksesta

Strive ostaa 2 500 bitcoinia, omistukset nousevat 19 000 bitcoiniin 4,2 miljardin dollarin rahoitussuunnitelman edetessä

VIIMEISIMMÄT UUTISET

Altcoin-kausindeksi on 49 — kauppiaat tarvitsevat bitcoinin markkinaosuuden laskevan alle 55 prosenttiin, jotta siirtymä käynnistyy

Cryptoquant: Jokaisen bitcoinin pohjan takana oleva on-chain-raja on lähellä 40 prosenttia, mikä ei vielä riitä ”maksimaaliseen mahdollisuuteen”

Moonpay yhdistää rahoituslaitokset Franklin Templetonin tokenisoituihin rahastoihin osana uutta ketjupohjaista hanketta

”Tuomaristo teki virheen”: Citronin Andrew Left tuomittu arvopaperipetoksesta

Strive ostaa 2 500 bitcoinia, omistukset nousevat 19 000 bitcoiniin 4,2 miljardin dollarin rahoitussuunnitelman edetessä

LEHDISTÖTIEDOTTEET

Zoomex-ennustemarkkinat avataan virallisesti: osallistu maailmanlaajuisiin ajankohtaisiin tapahtumiin kryptovaluutalla

Securitize lanseeraa yksityisen luottorahaston TRON-lohkoketjussa

1win on solminut sopimuksen koko Tundra-joukkueen kanssa 1win-joukkueen nimissä

OKX listaa TRXUSD-erääntymättömät futuurit (X-Perp) ja tarjoaa MiFID-vaatimusten mukaisen pääsyn TRX-johdannaisiin

Kryptovaluutat kohtaavat Wall Streetin: MEXC esittelee ”RealStocks”-palvelun, joka tarjoaa palkkiotonta yhdysvaltalaisten osakkeiden kauppaa ja todellisia osinkoja

Aiheeseen liittyvät

Keyrockin raportti: 76 % tekoälypohjaisten maksutapahtumien käsittelymaksut jäävät alle Visan 0,30 dollarin vähimmäismaksurajan

Anthropic esittelee Claude Opus 4.7:n, kun agenttipohjaiset työnkulut nousevat keskiöön

Crossmintin Lobster.cash-palvelu integroi Mastercard Agent Pay -ratkaisun agenttipohjaiseen kaupankäyntiin

Raportti: Goldman Sachsin strategin mukaan tekoälyn aiheuttamaa mullistusta koskevat pelot vaivaavat ohjelmistoalan osakkeita vielä vuosia

Resident Evil -elokuvan tähti Milla Jovovich kehittää tekoälypohjaista muistityökalua yhdessä insinööri Ben Sigmanin kanssa

Deepmindin tutkimusartikkeli ”AI Agent Traps” kuvaa, miten hakkerit voisivat käyttää tekoälyagentteja käyttäjiä vastaan