Poháňa
News

Google uvádza na trh Ironwood TPU s 9 216 čipovými podmi a s kvapalinovým chladením

Google uvádza na trh Ironwood, svoj sedemgeneračný Tensor Processing Unit, špeciálne vyvinutý akcelerátor umelej inteligencie (AI), ktorý spoločnosť označuje ako najpokročilejší doteraz—navrhnutý pre efektívne inferencie vo veľkej miere a pripravený predbehnúť náskok Nvidie, keďže dostupnosť sa v nasledujúcich týždňoch rozširuje.

NAPÍSAL
ZDIEĽAŤ
Google uvádza na trh Ironwood TPU s 9 216 čipovými podmi a s kvapalinovým chladením

TPU Ironwood od Google cieli na územie Nvidie s výkonovým potenciálom na úrovni pod-škály FP8

Google predstavil Ironwood na Google Cloud Next ’25 v apríli a teraz rozširuje prístup, pričom čip pozicionuje ako zákazkový kremík ladený pre „vek inferencie,“ keď sa očakáva, že modely budú v reálnom čase reagovať, racionálne uvažovať a generovať v globálnych cloudových oblastiach.

Podľa správy CNBC tento krok jednoznačne zapadá do širšieho mocenského ťaženia medzi hyperskalermi, ktorých cieľom je vlastniť AI stack od dátového centra až po vývojárske nástroje. V hĺbke Ironwood vsádza na 3D torus interconnection, kvapalinové chladenie pre udržateľné zaťaženia a vylepšené Sparsecore na urýchlenie ultra-veľkých vkladov pre hodnotenie, odporúčania, financie a vedecké výpočty.

Je navrhnutý tak, aby minimalizoval pohyb dát a komunikačné úzke miesta—dvoch vinníkov, ktoré často obmedzujú priechodnosť v pracovných úlohách s viacerými čipmi. Surové čísla sú navrhnuté tak, aby zaujali: až 4,614 TFLOPov (FP8) na čip, 192 GB HBM so šírkou pásma 7,37 TB/s a obojsmernou šírkou pásma medzi čipmi 1,2 TB/s. Pody sa škálujú od 256 čipov po konfiguráciu s 9,216 čipmi, ktorá dodáva 42,5 exaflops (FP8) výpočtového výkonu, s celkovým plno-podovým odberom energie približne 10 MW a kvapalinové chladenie umožňuje výrazne vyšší udržateľný výkon ako vzduch.

Google uvádza, že Ironwood je viac než 4× rýchlejší ako predchádzajúci Trillium (TPU v6) v celkovom priepuste AI a ponúka zhruba 2× lepší výkon na watt—pričom dosahuje takmer 30× energetickú účinnosť svojho prvej Cloud TPU z roku 2018. V maximálnej forme spoločnosť tvrdí, že má výpočtovú výhodu nad vrcholovými superpočítačmi ako El Capitan, keď sa merajú na FP8 exaflopoch. Ako vždy, metodológia je dôležitá, ale zámer je jasný.

Aj keď dokáže trénovať, Ironwood sa zameriava na inferenciu pre veľké jazykové modely a systémy Mixture-of-Experts—presne tie vysoko-QPS, nízkolatenčné úlohy, ktoré teraz zaplavujú dátové centrá od Severnej Ameriky po Európu a Áziu-Pacifik. Predstavte si chatbotov, agentov, modely triedy Gemini a vysoko-dimenzionálne vyhľadávacie a recsys pipeline, ktoré vyžadujú rýchlu pamäť a presné sychronizovanie na úrovni podu.

Integrácia prebieha cez AI Hypercomputer na Google Cloud—spájanie hardvéru so softvérom ako Pathways na koordinovanie distribuovaného výpočtu cez tisíce dieľ. Tento stack už podporuje spotrebiteľské a podnikové služby od Vyhľadávania po Gmail a Ironwood sa začleňuje ako upgrade pre zákazníkov, ktorí chcú manažovanú, TPU-native cestu popri GPU.

Existuje prevádzková správa, ktorá je v tom zaobalená: Google vyzýva dominanciu Nvidie tým, že tvrdí, že špecifické TPUs pre konkrétnu oblasť môžu poraziť všeobecné GPUs na základe pomeru ceny a výkonu a energetickej spotreby pre určité úlohy AI. Správa CNBC uvádza, že prvými adoptraditeľmi sú Anthropic, ktorí plánujú nasadenia v meradle miliónov TPU pre Claude—významný signál, ako veľké inkferenčné stopáže sa stávajú.

Generálny riaditeľ Alphabet Sundar Pichai rámoval dopyt ako kľúčový hnací motor príjmov, pričom zaznamenal nárast príjmov z Google Cloudu o 34% na 15,15 miliardy dolárov v Q3 2025 a kapitálové výdavky súvisiace s AI rozširovaním, ktoré dosahujú 93 miliárd dolárov. „Vidíme značný dopyt po našich AI infraštruktúrových produktoch… a investujeme, aby sme ho uspokojili,“ povedal a poznamenal, že viac miliardových zmlúv bolo podpísaných tento rok než v predchádzajúcich dvoch spojených.

Širšia dostupnosť Ironwood je naplánovaná na koniec roku 2025 prostredníctvom Google Cloudu, pričom žiadosti o prístup sú už otvorené. Pre podniky v USA, Európe a Ázii-Pacifiku posudzujúce energetické rozpočty, hustotu rackov a cieľové latencie, otázka nie je o humbuku, ale či Ironwoodova matematika a chladiaci profil na úrovni podu FP8 zodpovedajú ich produkčným nákladom.

FAQ ❓

  • Kde bude Ironwood dostupný? Prostredníctvom Google Cloudu v globálnych oblastiach, vrátane Severnej Ameriky, Európy a Ázie-Pacifiku.
  • Kedy sa začne prístup? Širšia dostupnosť začína v nasledujúcich týždňoch, s rozšírením na konci roku 2025.
  • Na aké úlohy je určený? Vysoko priepustné inferencie pre LLMs, MoEs, vyhľadávania, odporúčania, financie a vedecké výpočty.
  • Ako sa porovnáva s predchádzajúcimi TPUs? Google uvádza 4× vyšší priepust a 2× lepší výkon na watt než Trillium.
Značky v tomto článku