द्वारा संचालित
News

Google ने Ironwood TPU पेश किया जिसमें 9,216-चिप पॉड्स और लिक्विड कूलिंग शामिल है।

Google अपने सातवें-पीढ़ी के टेंसर प्रोसेसिंग यूनिट, आयरनवुड को जारी कर रहा है, जो एक विशेष रूप से निर्मित आर्टिफिशियल इंटेलीजेंस (AI) एक्सेलेरेटर है जिसे कंपनी अपनी अब तक की सबसे उन्नत रूप में प्रस्तुत कर रही है—जिसे कुशल, बड़े पैमाने पर इनफेरेंस के लिए बनाया गया है और जैसा कि उपलब्धता आने वाले हफ्तों में बढ़ती है, यह Nvidia की बढ़त को चुनौती देने के लिए तैयार है।

लेखक
शेयर
Google ने Ironwood TPU पेश किया जिसमें 9,216-चिप पॉड्स और लिक्विड कूलिंग शामिल है।

Google का Ironwood TPU Nvidia की पकड़ को Pod-Scale FP8 शक्ति के साथ लक्षित करता है

Google ने अप्रैल में Google Cloud Next ’25 पर Ironwood का पूर्वावलोकन किया था और अब पहुंच को व्यापक करते हुए इस चिप को “अधिग्रहण के युग” के लिए अनुकूलित कस्टम सिलिकॉन के रूप में प्रस्तुत कर रहा है, जब मॉडेल्स से उम्मीद की जाती है कि वे वास्तविक समय में वैश्विक क्लाउड क्षेत्रों में प्रतिक्रिया, कारण और उत्पादन करेंगे।

CNBC की रिपोर्ट के अनुसार, यह कदम हायपरस्केलर्स के बीच एक व्यापक शक्ति नाटक में भली भांति फिट बैठता है जो डेटा सेंटर से डेवलपमेंट टूलकिट तक एआई स्टैक पर अधिकार जमाने के लिए दौड़ रहे हैं। अंदर से, आयरनवुड एक 3D टोरस इंटरकनेक्ट, सतत लोड्स के लिए तरल कूलिंग और रैंकिंग, सिफारिशें, वित्त और वैज्ञानिक कंप्यूटिंग के लिए अल्ट्रा-लार्ज एम्बेडिंग्स को गति देने के लिए एक बेहतर Sparsecore पर निर्भर करता है।

यह तैयार किया गया है डेटा मूवमेंट और संचार रुकावटों को कम करने के लिए—दो दोष जो अक्सर मल्टी-चिप नौकरियों में थ्रूपुट को सीमित करते हैं। कच्चे आंकड़े ध्यान खींचने के लिए डिज़ाइन किए गए हैं: प्रति चिप 4,614 TFLOPs (FP8), 192 GB का HBM 7.37 TB/s बैंडविड्थ के साथ, और 1.2 TB/s द्विदिश अंतर-चिप बैंडविड्थ। पॉड्स 256 चिप्स से 9,216-चिप कॉन्फ़िगरेशन में बढ़ते हैं, जो 42.5 एक्साफ्लॉप्स (FP8) की गणना प्रदान करते हैं, पूर्ण-पॉड पॉवर खींच लगभग 10 MW के आसपास होता है और तरल कूलिंग वायु की तुलना में काफी उच्च सतत प्रदर्शन सक्षम करता है।

Google का कहना है कि आयरनवुड पूर्ववर्ती त्रिलियम (TPU v6) की तुलना में कुल मिलाकर AI थ्रूपुट में 4× अधिक तेज़ है और प्रति वाट लगभग 2× बेहतर प्रदर्शन प्रदान करता है—जबकि इसकी पहली Cloud TPU की विद्युत दक्षता लगभग 30× है। पूरी तरह से भरी हुई अवस्था में, कंपनी का दावा है कि इसे FP8 एक्साफ्लॉप्स पर मापे जाने वाले शीर्ष सुपरकंप्यूटर जैसे कि एल कैपिटान के साथ कंप्यूटेशनल बढ़त होती है। जैसे हमेशा, पद्धति महत्वपूर्ण है, लेकिन इरादा स्पष्ट है।

हालांकि यह प्रशिक्षण कर सकता है, आयरनवुड की पिच बड़ी भाषाई मॉडल्स और विशेषज्ञ प्रणाली के लिए इनफेरेंस पर केंद्रित है—यही उच्च QPS, कम विलंबता का कार्य वर्तमान में उत्तर अमेरिका से यूरोप और एशिया-प्रशांत तक डेटा सेंटर्स में बाढ़ ला रहा है। तरह चैटबोट्स, एजेंट्स, Gemini-क्लास मॉडल्स, और उच्च-आयाम खोज और recsys पाइपलाइनों के लिए तेज़ मेमोरी और कड़े पॉड-स्केल सिंक की आवश्यकता होती है।

एकीकरण गूगल क्लाउड के एआई हाइपरकंप्यूटर के माध्यम से आता है—जो हार्डवेयर के साथ सॉफ़्टवेयर की जैसे कि पाथवे के संयोजन को अंजाम देने के लिए हजारों डाईज़ के पार वितरणात्मक कंप्यूट को ऑर्केस्ट्रेट करता है। वह स्टैक पहले से ही खोज से लेकर जीमेल तक उपभोक्ता और उद्यम सेवाओं का समर्थन करता है, और आयरनवुड उन ग्राहकों के लिए एक उन्नयन पथ के रूप में स्लॉट करता है जो जीपीयू के साथ-साथ एक प्रबंधित, TPU-नेटीव मार्ग चाहते हैं।

इसमें एक बाजार संदेश निहित है: गूगल यह तर्क देकर Nvidia का प्रभुत्व चुनौती दे रहा है कि डोमेन-विशिष्ट TPUs कुछ AI कार्यों के लिए मूल्य-प्रदर्शन और ऊर्जा उपयोग पर सामान्य-उद्देश्य जीपीयू को हरा सकते हैं। CNBC की रिपोर्ट में कहा गया है कि प्रारंभिक उपयोगकर्ताओं में शामिल हैं Anthropic, जो मिली-टीपीयू पैमाने पर Claude के लिए प्रयोग तैनाती करने की योजना बनाता है—यह संकेत मिलाते हुए कि इनफेरेंस फुटप्रिंट कितने बड़े हो रहे हैं।

Alphabet के CEO सुंदर पिचाई ने मांग को प्रमुख राजस्व चालक के रूप में प्रस्तुत किया, Q3 2025 में गूगल क्लाउड राजस्व में 34% की वृद्धि का हवाला देते हुए $15.15 बिलियन और AI विस्तार के लिए समग्र पूंजीगत व्यय $93 बिलियन में दर्शाया। “हम अपने एआई ढांचे उत्पादों के लिए महत्वपूर्ण मांग देख रहे हैं… और हम इसे पूरा करने के लिए निवेश कर रहे हैं,” उन्होंने कहा, यह बताते हुए कि इस वर्ष पहले दो संयुक्त की तुलना में अधिक अरब डॉलर के सौदे पर हस्ताक्षर किए गए हैं।

आयरनवुड की व्यापक उपलब्धता 2025 के अंत में गूगल क्लाउड के माध्यम से निर्धारित की गई है, और अब प्रवेश अनुरोध खुले हैं। अमेरिका, यूरोप और एशिया-प्रशांत में कंपनियों के लिए बिजली बजट, रैक घनत्व, और विलंबता लक्ष्यों का वजन करते हुए, सवाल अनुमान पर कम और इस पर अधिक है कि आयरनवुड का पॉड-स्केल FP8 गणित और कूलिंग प्रोफाइल उनके उत्पादन कार्यभार के साथ मेल खाते हैं या नहीं।

FAQ ❓

  • आयरनवुड कहां उपलब्ध होगा? गूगल क्लाउड द्वारा वैश्विक क्षेत्रों में, जिसमें उत्तर अमेरिका, यूरोप और एशिया-प्रशांत शामिल हैं।
  • कब तक पहुंच शुरू होती है? आने वाले कुछ हफ्तों में व्यापक उपलब्धता शुरू होती है, पूरे 2025 में व्यापक रोलआउट के साथ।
  • यह किस कार्यभार के लिए बनाया गया है? उच्च-थ्रूपुट इनफेरेंस के लिए LLMs, MoEs, खोज, सिफारिशें, वित्त, और वैज्ञानिक कंप्यूटिंग के लिए।
  • यह पिछले TPUs की तुलना में कैसे है? गूगल का दावा है कि यह त्रिलियम की तुलना में 4× उच्च थ्रूपुट और 2× बेहतर प्रदर्शन प्रति वाट प्रदान करता है।
इस कहानी में टैग