Pokreće
News

Google pokreće Ironwood TPU sa skupovima od 9.216 čipova i tekućim hlađenjem

Google uvodi Ironwood, svoju sedmu generaciju jedinice za obradu tenzora, posebno izrađen akcelerator umjetne inteligencije (AI) koji tvrtka reklamira kao svoj najnapredniji do sada—izrađen za učinkovitu inferencu u velikim skalama i spreman da izazove dominaciju Nvidije kako se dostupnost proširuje u nadolazećim tjednima.

PODIJELI
Google pokreće Ironwood TPU sa skupovima od 9.216 čipova i tekućim hlađenjem

Googleov Ironwood TPU cilja Nvidijin teritorij s pod-skalnom FP8 snagom

Google je predstavio Ironwood na Google Cloud Next ’25 u travnju i sada širi pristup, postavljajući čip kao prilagođeni silikon podešen za “doba inferencijalnosti”, kada se očekuje da modeli odgovaraju, razmišljaju i generiraju u stvarnom vremenu širom globalnih oblaka.

Prema CNBC izvješću, ovaj potez se uklapa u širu igru moći među hiperskalersima koji se natječu za posjedovanje AI sloja od podatkovnog centra do razvojnih alata. Ispod haube, Ironwood se oslanja na 3D torus međusobnu povezanost, tekuće hlađenje za dugotrajne terete i poboljšani Sparsecore za ubrzanje ultra-velikih ugradnji za rangiranje, preporuke, financije i znanstvene proračune.

Inženjerisan je kako bi minimalizirao pomicanje podataka i uska grla u komunikaciji—dva faktora koja često ograničavaju propusnost u multi-čip poslovima. Brutalne brojke su osmišljene da privuku pažnju: do 4,614 TFLOPS (FP8) po čipu, 192 GB HBM-a sa 7.37 TB/s propusnosti, i 1.2 TB/s dvosmjerne međučipne propusnosti. Podovi skaliraju od 256 čipova do konfiguracije sa 9,216 čipova koja isporučuje 42.5 ekshaflopa (FP8) obrade, s potrošnjom energije cijelog poda oko 10 MW i tekućim hlađenjem koje omogućuje značajno višu održivu izvedbu nego zračno.

Google kaže da je Ironwood više od 4× brži od prethodnog Trilliuma (TPU v6) u ukupnom AI propusnom opsegu i nudi otprilike 2× bolju izvedbu po vatu—dok postiže gotovo 30× energetsku učinkovitost svoje prve Cloud TPU iz 2018. U maksimalnoj konfiguraciji, tvrtka tvrdi prednost u računalnoj snazi nad vrhunskim superračunalima kao što je El Capitan kada se mjeri na FP8 ekshaflopu. Kao i uvijek, metodologija je važna, ali namjera je jasna.

Iako može trenirati, Ironwood se fokusira na inferencu za velike jezične modele i Mixture-of-Experts sustave—točno onaj visokog QPS-a, niske latencije posla koji sada preplavljuje podatkovne centre od Sjeverne Amerike do Europe i Azijsko-Pacifičke regije. Pomislite na chatbotove, agente, modele Gemini klase, i pipeline za pretragu i preporuke koji zahtijevaju brzu memoriju i preciznu sinkronizaciju podova.

Integracija dolazi putem Google Cloudovog AI Hiperračunala—spajajući hardver sa softverom poput Pathways-a za orkestriranje distribuirane obrade preko tisuća čipova. Taj sloj već podržava potrošačke i poslovne usluge od Pretrage do Gmail-a, a Ironwood se integrira kao put nadogradnje za kupce koji žele upravljani, TPU-nativni put uz GPU-ove.

Poruka na tržištu je jasno izražena: Google osporava dominaciju Nvidije argumentirajući da specifični TPUs mogu pobijediti general-purpose GPU-ove po cjenovnoj izvedbi i energetskoj upotrebi za određene AI zadatke. CNBC izvještava da su prvi usvojitelji uključujućiAnthropic, koji planira implementacije na milijunaškoj skali za Claude—a to je iznenađujući signal koliko veliki postaju tragovi inferencijalnosti.

Izvršni direktor Alphabeta Sundar Pichai prikazao je potražnju kao ključni pokretač prihoda, navodeći 34% skok prihoda od Google Clouda na 15,15 milijardi USD u Q3 2025 i kapitalna ulaganja povezana s AI izgradnjom koja iznose 93 milijarde USD. “Vidimo značajnu potražnju za našim AI infrastrukturnim proizvodima… i ulažemo da je zadovoljimo“, rekao je, napominjući da je ove godine potpisano više milijardih poslova nego u prethodne dvije zajedno.

Šira dostupnost Ironwooda planirana je za kasnije u 2025. putem Google Clouda, a zahtjevi za pristup su otvoreni sada. Za poduzeća u SAD-u, Europi i diljem Azijsko-Pacifičke regije koja se bave potrošnjom energije, gustoćom racka i ciljevima kašnjenja, pitanje je manje o hajpu, a više o tome odgovara li Ironwood’s pod-skalni FP8 matematički i profil hlađenja njihovim proizvodnim poslovima.

FAQ ❓

  • Gdje će biti dostupan Ironwood? Preko Google Clouda u globalnim regijama, uključujući Sjevernu Ameriku, Europu i Azijsko-Pacifičku regiju.
  • Kada počinje pristup? Šira dostupnost počinje u nadolazećim tjednima, s širom implementacijom kasnije u 2025.
  • Za koje radne opterećenja je izgrađen? Visoka propusnost inferencije za LLM-ove, MoE-ove, pretragu, preporuke, financije i znanstvene proračune.
  • Kako se uspoređuje s prethodnim TPU-ovima? Google navodi 4× veći propusni opseg i 2× bolju izvedbu po vatu u odnosu na Trillium.