Toetab
News

Google toob turule Ironwood TPU, millel on 9,216 kiibi moodulid ja vedelikjahutus

Google toob turule Ironwoodi, oma seitsmenda põlvkonna Tensor Processing Unit’i, mis on spetsiaalselt ehitatud tehisintellekti (AI) kiirendiks, mida ettevõte reklaamib kui oma seni kõige arenenumat – ehitatud tõhusaks ja ulatuslikuks järeldamiseks ning valmis tõukama Nvidiat liidripositsioonilt, kuna saadavus laieneb lähinädalatel.

KIRJUTAS
JAGA
Google toob turule Ironwood TPU, millel on 9,216 kiibi moodulid ja vedelikjahutus

Google’i Ironwood TPU sihib Nvidia valdust Pod-Scale FP8 jõudlusega

Google andis Ironwoodist eelvaate aprillis toimunud Google Cloud Next ’25 konverentsil ning nüüd laieneb ligipääs, positsioneerides kiibi spetsiaalse silikoona, mis on häälestatud „järeldamise ajastuks“, mil mudelitelt oodatakse reaalajas vastamist, põhjendamist ja genereerimist ülemaailmsete pilvepiirkondade kaudu.

CNBC aruande kohaselt on see samm strateegiliseks positsioneerimiseks AI virna omamisvõitluses hüperskaleerijate vahel, kes püüavad haarata kontrolli andmekeskusest arendustööriistani. Tegelikult tugineb Ironwood 3D-toruse ühendusele, vedelikjahutusele pidevate koormuste jaoks ja täiustatud Sparsecore’ile, et kiirendada ülisuurte manuste töötlemist edetabelites, soovitustes, finants- ja teaduslikes arvutustes.

See on kujundatud minimeerima andmeliikumise ja suhtluse kitsaskohti – need kaks tegurit, mis tihti piiravad läbilaskevõimet mitme kiibiga tööülesannetes. Toornumbrid on loodud tähelepanu köitmiseks: kuni 4,614 TFLOP-i (FP8) kiibi kohta, 192 GB HBM 7,37 TB/s ribalaiusega ja 1,2 TB/s kahepoolne kiibivaheline ribalaius. Poodiumid laienevad 256 kiibist kuni 9,216 kiibi konfiguratsioonini, pakkudes 42,5 exafloppi (FP8) arvutusvõimsust, täispoodi energiatarbimisega umbes 10 MW ja vedelikjahutus võimaldab märkimisväärselt suuremat pidevat sooritust kui õhk.

Google väidab, et Ironwood on enam kui 4× kiirem kui eelmine Trillium (TPU v6) üldises AI läbilaskevõimes ja pakub umbes 2× paremat jõudlust vati kohta – samal ajal kui selle esimene Cloud TPU aastast 2018 jõuab peaaegu 30× energiatõhususeni. Maksimaalses vormis väidab ettevõte arvutuslikku eelist selliste tipp-superarvutite ees nagu El Capitan, kui mõõdetuna FP8 exafloppides. Alati on oluline ka metoodika, kuid kavatsus on selge.

Kuigi see suudab treenida, keskendub Ironwoodi pakkumine järeldamisele suurte keelemudelite ja Ekspertide Kombinatsiooni süsteemide jaoks – just need kõrg-QPS, madala latentsusega tööd, mis nüüd ujutavad üle andmekeskusi Põhja-Ameerikast Euroopani ja Aasia-Vaikse ookeani piirkonnani. Mõelge vestlusbotid, agendid, Gemini-klassi mudelid ja kõrge dimensiooniga otsingud ning soovitusmasinavood, mis nõuavad kiiret mälu ja tihedat poomivahemiku sünkrooni.

Integreerimine toimub Google Cloudi AI Hüperarvuti kaudu – ühendades riistvara tarkvaraga, nagu Pathways, et orkestreerida hajutatud arvutusi tuhandete kiipide kaudu. See virn juba toetab nii tarbija- kui ärikliente teenustes alates Searchist kuni Gmailini ning Ironwood astub mängu täiendusena klientidele, kes soovivad hallatud, TPU-l põhinevat marsruuti GPU-de kõrval.

Siin peitub turusõnum: Google esitab väljakutse Nvidia domineerimisele väites, et domeenispetsiifilised TPU-d võivad teatud AI-tööde jaoks ületada üldotstarbelisi GPU-sid hinna ja energiatõhususe järgi. CNBC aruanne ütleb, et varased kasutuselevõtjad on Anthropic, mis plaanib kasutuselevõttu miljoni-TPU-skaalal Claude jaoks – tõsine signaal selle kohta, kui suureks muutuvad järelduste jäljed.

Alphabe’i tegevjuht Sundar Pichai sõnastas nõudluse peamise tuluallikana, viidates Google Cloudi tulude kasvu 34%ni 15,15 miljardi dollarini Q3 2025, kus AI kulutused ulatusid 93 miljardi dollarini. „Me näeme oma AI-infrastruktuuritoodete järele suurt nõudlust… ja me investeerime selle rahuldamiseks,“ ütles ta, märkides et sel aastal on sõlmitud rohkem miljardite dollarite tehinguid kui kahel eelneval aastal kokku.

Ironwoodi laiem saadavus on ette nähtud 2025. aasta lõpus läbi Google Cloudi, kus ligipääsu taotlused on avatud nüüd. Ameerika Ühendriikides, Euroopas ja Aasia-Vaikse ookeani piirkonnas võimu eelarveid, kõrgkiirust, racki tihedust ja latentsuse eesmärke kaalutledes, on küsimus vähem seotud hüüüpega ja rohkem sellega, kas Ironwoodi poodiumiskaalas FP8 matemaatika ja jahutusprofiil vastavad nende tootmistöökoormustele.

KKK ❓

  • Kus Ironwood saadaval on? Läbi Google Cloudi ülemaailmsetes piirkondades, sh Põhja-Ameerika, Euroopa ja Aasia-Vaikse ookeani piirkond.
  • Millal ligipääs algab? Laiem saadavus algab lähinädalatel, laiem avalikustamine toimub 2025. aasta lõpus.
  • Millistele töökoormustele see on loodud? Suure läbilaskevõimega järeldamiseks LLM-ide, MoE-de, otsingute, soovituste, finants- ja teadusarvutuste jaoks.
  • Kuidas see varasemate TPU-dega võrdub? Google viitab 4× suuremale läbilaskevõimele ja 2× paremale jõudlusele vati kohta kui Trillium.