NewsDiterbitkan:19 Apr 2026, 23.45

Nvidia Meluncurkan Nemotron 3 Super, Model OpenAI dengan 120 miliar parameter yang dirancang untuk beban kerja berbasis agen

Nvidia telah merilis Nemotron 3 Super, sebuah model hibrida terbuka dengan total 120 miliar parameter yang dirancang untuk menekan biaya komputasi dalam menjalankan agen kecerdasan buatan (AI) secara massal.

DITULIS OLEH

Jamie Redman

Diterbitkan: 19 Apr 2026, 23.45

Nvidia Meluncurkan Nemotron 3 Super, Model OpenAI dengan 120 miliar parameter yang dirancang untuk beban kerja berbasis agen

Poin Utama:

Nvidia meluncurkan Nemotron 3 Super, sebuah model MoE terbuka dengan 120 miliar parameter yang hanya mengaktifkan 12,7 miliar parameter per lintasan maju.
Nemotron 3 Super memberikan throughput hingga 7,5 kali lebih tinggi daripada Qwen3.5-122B-A10B dalam beban kerja agen pada pengaturan 8k-in/64k-out.
Model ini sepenuhnya terbuka di bawah Lisensi Model Terbuka Nvidia Nemotron, dengan titik pemeriksaan dan data pelatihan di Hugging Face.

Nvidia Meluncurkan Nemotron 3 Super dengan Peningkatan Throughput 7,5x Dibandingkan Qwen3.5-122B

Model terbaru Nvidia hanya mengaktifkan 12,7 miliar parameter per lintasan maju menggunakan arsitektur Mixture-of-Experts (MoE), artinya sebagian besar bobotnya tetap tidak aktif selama inferensi. Pilihan desain ini secara langsung menargetkan dua masalah yang dihadapi pengembang saat mengimplementasikan agen AI multi-langkah: biaya tambahan dari rantai penalaran yang diperpanjang dan penggunaan token yang melonjak hingga 15 kali lipat dalam pipa multi-agen.

Nemotron 3 Super adalah model kedua dalam keluarga Nemotron 3 Nvidia, menyusul Nemotron 3 Nano yang dirilis pada Desember 2025. Nvidia mengumumkan peluncurannya sekitar 10 Maret 2026.

Model ini menggunakan arsitektur hibrida Mamba-Transformer yang mencakup 88 lapisan. Blok Mamba-2 menangani urutan panjang dengan efisiensi waktu linier, sementara lapisan perhatian Transformer mempertahankan akurasi ingatan yang presisi. Kombinasi ini memberikan dukungan bawaan untuk jendela konteks hingga satu juta token tanpa penalti memori yang umumnya terjadi pada desain berbasis perhatian murni.

Nvidia juga mengintegrasikan sistem rute LatentMoE yang mengompresi embedding token ke dalam ruang peringkat rendah sebelum mengirimkannya ke 512 ahli per lapisan, dengan mengaktifkan 22 ahli sekaligus. Perusahaan menyatakan hal ini memungkinkan sekitar empat kali lebih banyak ahli dengan biaya inferensi yang sama dibandingkan pendekatan MoE standar, serta memfasilitasi spesialisasi tugas yang lebih halus, seperti memisahkan logika Python dari penanganan SQL pada tingkat ahli.

Nvidia Releases Nemotron 3 Super, a 120B Open AI Model Built for Agentic Workloads — Sumber gambar: Blog Nvidia.

Lapisan Prediksi Multi-Token, yang menggunakan dua kepala dengan bobot bersama, mempercepat pembangkitan rantai pemikiran dan memungkinkan dekoding spekulatif asli. Pada tugas terstruktur, Nvidia melaporkan pembangkitan hingga tiga kali lebih cepat.

Model ini dilatih sebelumnya pada 25 triliun token melalui dua fase. Fase pertama menggunakan 20 triliun token data umum. Fase kedua menggunakan lima triliun token berkualitas tinggi yang disesuaikan untuk kinerja benchmark. Fase ekstensi akhir pada 51 miliar token memperluas konteks asli hingga satu juta token. Pelatihan pasca-pelatihan mencakup penyempurnaan terawasi pada sekitar tujuh juta sampel dan pembelajaran penguatan di 21 lingkungan dengan lebih dari 1,2 juta iterasi.

Dalam pengujian benchmark, Nemotron 3 Super meraih skor 83,73 pada MMLU-Pro, 90,21 pada AIME25, dan 60,47 pada SWE-Bench menggunakan OpenHands. Pada PinchBench, model ini mencapai 85,6 persen, skor tertinggi yang dilaporkan di antara model terbuka dalam kelasnya. Pada evaluasi konteks panjang, model ini meraih skor 91,64 pada RULER 1M.

Dibandingkan dengan GPT-OSS-120B, Nemotron 3 Super menghasilkan throughput 2,2 kali lipat pada input 8k dan output 64k. Terhadap Qwen3.5-122B-A10B, angka tersebut mencapai 7,5 kali lipat. Nvidia juga melaporkan throughput lebih dari lima kali lipat dan akurasi hingga dua kali lipat dibandingkan generasi Nemotron Super sebelumnya.

Nvidia melatih model ini secara end-to-end dalam format bilangan floating-point empat bit NVFP4, yang dioptimalkan untuk GPU Blackwell. Pada perangkat keras B200, Nvidia menyatakan bahwa proses inferensi berjalan hingga empat kali lebih cepat dibandingkan FP8 pada H100 tanpa kehilangan akurasi yang dilaporkan. Titik pemeriksaan FP8 dan NVFP4 yang dikuantisasi mempertahankan 99,8 persen atau lebih dari akurasi presisi penuh.

Model ini juga mendukung agen penelitian Nvidia AI-Q, yang mencapai posisi teratas di papan peringkat Deepresearch Bench.

Nvidia Mendukung Rencana Pabrik AI Nebius dengan Investasi Besar Senilai $2 Miliar

Simak bagaimana Nvidia sedang membentuk masa depan komputasi melalui investasi senilai $2 miliar dalam infrastruktur cloud AI. read more.

Nvidia Mendukung Rencana Pabrik AI Nebius dengan Investasi Besar Senilai $2 Miliar

Simak bagaimana Nvidia sedang membentuk masa depan komputasi melalui investasi senilai $2 miliar dalam infrastruktur cloud AI. read more.

Nvidia Mendukung Rencana Pabrik AI Nebius dengan Investasi Besar Senilai $2 Miliar

Simak bagaimana Nvidia sedang membentuk masa depan komputasi melalui investasi senilai $2 miliar dalam infrastruktur cloud AI. read more.

Nemotron 3 Super sepenuhnya terbuka di bawah Lisensi Model Terbuka Nvidia Nemotron. Titik pemeriksaan dalam format BF16, FP8, dan NVFP4, beserta data pra-pelatihan, sampel pasca-pelatihan, dan lingkungan pembelajaran penguatan, tersedia di Hugging Face. Inferensi didukung melalui Nvidia NIM, build.nvidia.com, Perplexity, Openrouter, Together AI, Google Cloud, AWS, Azure, dan Coreweave, dengan opsi on-premises melalui Dell Enterprise Hub dan HPE.
Pengembang dapat mengakses resep pelatihan, panduan penyempurnaan, dan buku panduan inferensi melalui platform NeMo menggunakan vLLM, SGLang, dan TensorRT-LLM.

24 Mei 2026

Laporan Keyrock: 76% Transaksi Agen AI Berada di Bawah Batas Biaya Minimum Visa sebesar $0,30

News

17 Apr 2026

Anthropic Meluncurkan Claude Opus 4.7 Saat Alur Kerja Berbasis Agen Menjadi Sorotan Utama

Tag dalam cerita ini

Artificial intelligence (AI)Nvidia

BERITA TERBARU

Strategi STRC Memberikan Imbal Hasil 11,5% kepada Ayah Seorang Petani, Para Kritikus Menilai Hal Itu sebagai Taktik "Bait and Switch" Bitcoin

1 jam yang lalu

10 Sinyal Utama yang Diperhatikan Para Pedagang Saat Bitcoin, Saham, dan The Fed Menentukan Arah Pergerakan di Bulan Juni

3 jam yang lalu

XRP Tergeser di Bawah BNB dalam Peringkat Kuartal I 2026, Namun Data Institusional Terbaru Menunjukkan Sinyal Bullish

4 jam yang lalu

Pertarungan di Level $2.000: Ethereum Anjlok 32% pada 2026 Sementara BTC Tetap Stabil

5 jam yang lalu

Kontrak Berjangka Bitcoin Mencapai $42,6 Miliar di 11 Bursa — Inilah yang Ditunjukkan oleh Open Interest untuk Bulan Juni

6 jam yang lalu

Nvidia Meluncurkan Nemotron 3 Super, Model OpenAI dengan 120 miliar parameter yang dirancang untuk beban kerja berbasis agen

Nvidia Meluncurkan Nemotron 3 Super dengan Peningkatan Throughput 7,5x Dibandingkan Qwen3.5-122B

Nvidia Mendukung Rencana Pabrik AI Nebius dengan Investasi Besar Senilai $2 Miliar

Nvidia Mendukung Rencana Pabrik AI Nebius dengan Investasi Besar Senilai $2 Miliar

Nvidia Mendukung Rencana Pabrik AI Nebius dengan Investasi Besar Senilai $2 Miliar

Artikel terkait

Laporan Keyrock: 76% Transaksi Agen AI Berada di Bawah Batas Biaya Minimum Visa sebesar $0,30

Anthropic Meluncurkan Claude Opus 4.7 Saat Alur Kerja Berbasis Agen Menjadi Sorotan Utama

Tag dalam cerita ini

BERITA TERBARU

Strategi STRC Memberikan Imbal Hasil 11,5% kepada Ayah Seorang Petani, Para Kritikus Menilai Hal Itu sebagai Taktik "Bait and Switch" Bitcoin

10 Sinyal Utama yang Diperhatikan Para Pedagang Saat Bitcoin, Saham, dan The Fed Menentukan Arah Pergerakan di Bulan Juni

XRP Tergeser di Bawah BNB dalam Peringkat Kuartal I 2026, Namun Data Institusional Terbaru Menunjukkan Sinyal Bullish

Pertarungan di Level $2.000: Ethereum Anjlok 32% pada 2026 Sementara BTC Tetap Stabil

Kontrak Berjangka Bitcoin Mencapai $42,6 Miliar di 11 Bursa — Inilah yang Ditunjukkan oleh Open Interest untuk Bulan Juni

SIARAN PERS

BC.GAME: Para Staker BC Engine Telah Mendapatkan Hadiah Lebih dari $2 Juta

Falcon Finance dan Anchorage Digital Bank Meluncurkan fUSD, Stablecoin yang Kompatibel dengan GENIUS dan Menawarkan Imbalan di Ceffu

SODAX dan Bound Memungkinkan Perdagangan Bitcoin Asli di 18 Jaringan Tanpa Perlu Dibungkus

HTX Beraksi untuk Amal: Membagikan Kehangatan dan Perhatian kepada Anak-Anak di Pakistan pada Hari Pizza Bitcoin

Rain Menyediakan Likuiditas Senilai $100 Juta Menjelang Peluncuran V2 dan Ekspansi Piala Dunia, Menjadi Pasar Prediksi Terbesar Ketiga di Dunia Berdasarkan TVL

BERITA TERBARU

Strategi STRC Memberikan Imbal Hasil 11,5% kepada Ayah Seorang Petani, Para Kritikus Menilai Hal Itu sebagai Taktik "Bait and Switch" Bitcoin

10 Sinyal Utama yang Diperhatikan Para Pedagang Saat Bitcoin, Saham, dan The Fed Menentukan Arah Pergerakan di Bulan Juni

XRP Tergeser di Bawah BNB dalam Peringkat Kuartal I 2026, Namun Data Institusional Terbaru Menunjukkan Sinyal Bullish

Pertarungan di Level $2.000: Ethereum Anjlok 32% pada 2026 Sementara BTC Tetap Stabil

Kontrak Berjangka Bitcoin Mencapai $42,6 Miliar di 11 Bursa — Inilah yang Ditunjukkan oleh Open Interest untuk Bulan Juni

BERITA TERBARU

Strategi STRC Memberikan Imbal Hasil 11,5% kepada Ayah Seorang Petani, Para Kritikus Menilai Hal Itu sebagai Taktik "Bait and Switch" Bitcoin

10 Sinyal Utama yang Diperhatikan Para Pedagang Saat Bitcoin, Saham, dan The Fed Menentukan Arah Pergerakan di Bulan Juni

XRP Tergeser di Bawah BNB dalam Peringkat Kuartal I 2026, Namun Data Institusional Terbaru Menunjukkan Sinyal Bullish

Pertarungan di Level $2.000: Ethereum Anjlok 32% pada 2026 Sementara BTC Tetap Stabil

Kontrak Berjangka Bitcoin Mencapai $42,6 Miliar di 11 Bursa — Inilah yang Ditunjukkan oleh Open Interest untuk Bulan Juni

Artikel terkait

Laporan Keyrock: 76% Transaksi Agen AI Berada di Bawah Batas Biaya Minimum Visa sebesar $0,30

Anthropic Meluncurkan Claude Opus 4.7 Saat Alur Kerja Berbasis Agen Menjadi Sorotan Utama

Lobster.cash dari Crossmint Mengintegrasikan Mastercard Agent Pay untuk Agentic Commerce

Laporan: Ahli Strategi Goldman Sachs Mengatakan Kekhawatiran Terkait Gangguan Akibat AI Akan Tetap Menghantui Saham Perangkat Lunak Selama Bertahun-tahun

Bintang Resident Evil, Milla Jovovich, Mengembangkan Alat Memori Berbasis Kecerdasan Buatan Bersama Insinyur Ben Sigman

Makalah Deepmind berjudul 'AI Agent Traps' Memetakan Cara-cara yang Dapat Digunakan Peretas untuk Memanfaatkan Agen AI sebagai Senjata Terhadap Pengguna