Google zavádí Ironwood, svou sedmou generaci Tensor Processing Unit, specializovaný akcelerátor pro umělou inteligenci (AI), který společnost označuje jako dosud nejpokročilejší – navržený pro efektivní inferenci v měřítku a připravený konkurovat vedoucí pozici Nvidie, protože dostupnost se rozšíří v nadcházejících týdnech.
Google spouští Ironwood TPU s 9 216 čipy v modulech a kapalinovým chlazením

Google’s Ironwood TPU míří na území Nvidie s pod-úrovňovým FP8 výkonem
Google představilo Ironwood na Google Cloud Next ’25 v dubnu a nyní rozšiřuje přístup, představuje čip jako na míru upravený silikon pro “věk inference”, kdy se očekává, že modely budou reagovat, uvažovat a generovat v reálném čase napříč globálními cloudovými regiony.
Podle zprávy CNBC tento tah zapadá přesně do širšího boje o moc mezi hyperskaléry snažícími se vlastnit AI stack od datového centra po vývojářské nástroje. Pod povrchem Ironwood spoléhá na 3D torus interconnect, kapalinové chlazení pro dlouhodobé zátěže a vylepšený Sparsecore pro urychlení ultra-velkých vnoření pro hodnocení, doporučování, finance a vědecké výpočty.
Je navržen tak, aby minimalizoval pohyb dat a komunikační úzká hrdla – dva viníky, které často omezují propustnost u úloh s více čipy. Čistá čísla jsou navržena tak, aby upoutala pozornost: až 4,614 TFLOPs (FP8) na čip, 192 GB HBM s šířkou pásma 7.37 TB/s, a 1.2 TB/s obousměrnou šířku pásma mezi čipy. Pody se škálují od 256 čipů až po konfiguraci s 9,216 čipy, která poskytuje 42.5 exaflops (FP8) výpočetního výkonu, s plným výkonem podu kolem 10 MW a kapalinové chlazení umožňuje výrazně vyšší dlouhodobý výkon než chlazení vzduchem.
Google říká, že Ironwood je více než 4× rychlejší než předchozí Trillium (TPU v6) v celkové propustnosti AI a nabízí asi 2× lepší výkon na watt – zatímco dosahuje téměř 30× energetické účinnosti oproti své první Cloud TPU z roku 2018. V maximálním výkonnostním režimu společnost říká, že má výpočetní výhodu nad vrcholnými superpočítači jako El Capitan při měření v exaflops FP8. Jak vždy, metodika má přitom význam, ale záměr je jasný.
Zatímco může trénovat, hlavním nabídkou Ironwoodu je inference pro velké jazykové modely a systémy Mixture-of-Experts – přesně ta práce s vysokým počtem dotazů za sekundu (QPS) a nízkou latencí, která nyní zaplavuje datové centra od Severní Ameriky po Evropu a Asii-Pacifik. Představte si chatboty, agenti, modely třídy Gemini a vysoce-dimenzionální vyhledávání a recsys potrubí, které vyžadují rychlou paměť a těsně synchronizovaný provoz na úrovni podu.
Integrace probíhá přes Google Cloud’s AI Hypercomputer – spojuje hardware se softwarem jako Pathways pro orchestraci distribuovaného výpočtu přes tisíce čipů. Tento stack již podporuje spotřebitelské a podnikové služby od Vyhledávače až po Gmail a Ironwood je připraven jako upgradeová cesta pro zákazníky, kteří chtějí spravovanou, TPU-nativní trasu vedle GPU.
Součástí je tržní sdělení: Google vyzývá dominanci Nvidie argumentací, že doménově specifické TPUs mohou překonat univerzální GPUs v poměru cena-výkon a spotřebu energie pro určité AI úlohy. CNBC zpráva říká, že první uživatelé zahrnují Anthropic, který plánuje nasazení na stupnici milionů TPU pro Claude – pozoruhodný signál, jak velké inference stopy se stávají.
Generální ředitel společnosti Alphabet Sundar Pichai prezentoval poptávku jako klíčový motor příjmů a uvedl 34% nárůst příjmů Google Cloudu na 15.15 miliard dolarů ve 3. čtvrtletí 2025 a kapitálové výdaje spojené s AI ve výši 93 miliard dolarů. “Vidíme značnou poptávku po našich AI infrastrukturních produktech… a investujeme, abychom ji uspokojili,” řekl a poznamenal, že letos bylo podepsáno více miliardových smluv než v předchozích dvou letech společně.
Širší dostupnost Ironwoodu je plánována na pozdější polovinu roku 2025 přes Google Cloud, přičemž žádosti o přístup jsou nyní otevřeny. Pro podniky v USA, Evropě a po celém Asijsko-pacifickém regionu, které zvažují energetické rozpočty, hustotu racků a cíle latence, otázka není o hype, ale o tom, zda pod-škálové FP8 výpočty Ironwoodu a profil chlazení odpovídají jejich produkčním pracovním zátěžím.
FAQ ❓
- Kde bude Ironwood dostupný? Prostřednictvím Google Cloud v globálních regionech, včetně Severní Ameriky, Evropy a Asie-Pacifik.
- Kdy začíná přístup? Rozšířená dostupnost začíná v nadcházejících týdnech, s širším zavedením později v roce 2025.
- Pro jaké pracovní zátěže je stavěn? Vysoce-propustné inference pro LLMs, MoEs, vyhledávání, doporučování, finance a vědecké výpočty.
- Jak se porovnává s předchozími TPUs? Google uvádí 4× vyšší propustnost a 2× lepší výkon na watt než Trillium.















