تقوم جوجل بطرح Ironwood، الجيل السابع من وحدة معالجة التنسور (TPU)، وهي مسرع الذكاء الاصطناعي المصمم خصيصًا والذي تروج له الشركة باعتباره الأكثر تقدمًا حتى الآن – مصمم لتحقيق كفاءة عالية في التنبؤ على نطاق واسع وجاهز لمنافسة الصدارة الخاصة بشركة Nvidia حيث يتوسع توفره في الأسابيع القادمة.
تطرح Google وحدة TPU من نوع Ironwood مع حاويات تحتوي على 9,216 شريحة وتبريد سائل

TPU Ironwood من جوجل يستهدف عروض Nvidia بقوة Pod-Scale FP8
عرضت جوجل Ironwood في Google Cloud Next ’25 في أبريل والآن توسع نطاق الوصول، مما يضع الشريحة كسيليكون مخصص مضبوط لعصر التنبؤ، حين يتوجب على النماذج الاستجابة واتخاذ القرارات والإنشاء في الوقت الفعلي عبر مناطق السحابة العالمية.
وفقًا لـ تقرير CNBC، فإن هذه الخطوة تندمج بشكل تام في إستراتيجية توسعية أكبر بين مشغلي الحوسبة الكبرى الذين يسعون لامتلاك مجموعة الذكاء الاصطناعي من مركز البيانات إلى أدوات التطوير. وتعتمد Ironwood من الداخل على توصيلات ثلاثية الأبعاد توروس، والتبريد السائل للأحمال المستمرة، وجزء أساسي محسن لتسريع إدراجات كبيرة جدًا للتصنيف، والتوصيات، والمالية، والحوسبة العلمية.
إنه مهندَس لتقليل حركة البيانات واختناقات الاتصال – وهما السببان اللذان غالبًا ما يحددان الإنتاجية في الوظائف متعددة الشرائح. الأرقام الخام مصممة لشد الانتباه: تصل إلى 4,614 TFLOPs (FP8) لكل شريحة، 192 جيجابايت من HBM مع 7.37 تيرابايت/ثانية من عرض النطاق الترددي، و1.2 تيرابايت/ثانية من عرض النطاق الترددي متعدد الاتجاهات للشريحة. تتراوح طاقة البود من 256 شريحة إلى تكوين من 9,216 شريحة يوفر 42.5 إكسافلوب (FP8) من القدرة الحاسوبية، بقوة كاملة للبود حوالي 10 ميجاوات والتبريد السائل يتيح أداءً مستمرًا أعلى بكثير من الهواء.
تقول جوجل إن Ironwood أسرع بأكثر من 4 مرات من Trillium (TPU v6) السابق في إجمالي القدرة الحاسوبية للذكاء الاصطناعي ويوفر أداءً أفضل بحوالي 2× لكل واط – في حين يحقق كفاءة طاقة تقارب 30× من الوحدات السحابية الأولى TPU في 2018. في حالته القصوى، تزعم الشركة ميزة حسابية فوق أفضل الحواسيب العملاقة مثل El Capitan عندما تقاس في قدرتها الحاسوبية FP8 إكسافلوب. وكما هو الحال دائمًا، فإن المنهجية مهمة، ولكن النية واضحة.
بينما يمكنه التدريب، يركز Ironwood على التنبؤ بالنسبة لنماذج اللغة الكبيرة وأنظمة خليط الخبراء – وهي بالتحديد الأعمال عالية QPS والكمون المنخفض التي تغمر الآن مراكز البيانات من أمريكا الشمالية إلى أوروبا ومنطقة آسيا والمحيط الهادئ. فكر في الشات بوتات، والوكلاء، ونماذج فئة Gemini، وأنابيب البحث والتوصية عالية الأبعاد التي تتطلب ذاكرة سريعة وتزامنًا ضيقًا على مستوى البود.
التكامل يصل من خلال Hypercomputer AI السحابي من جوجل – يجمع الأجهزة مع البرمجيات مثل Pathways لتنظيم الحساب الموزع عبر آلاف الرقائق. ذلك التراكم يدعم بالفعل الخدمات الاستهلاكية والشركات من البحث إلى جيميل، وIronwood مدمج كمسار ترقية للعملاء الذين يرغبون في مسار أصلي لـTPU مُدار جنبًا إلى جنب مع وحدات معالجة الرسومات.
هناك رسالة تسويقية مدمجة: جوجل تتحدى سيطرة Nvidia بالقول إن وحدات TPU الخاصة بالمجال يمكن أن تتفوق على وحدات معالجة الرسومات الغرض العام من حيث الأداء السعري وكفاءة الطاقة في مهام الذكاء الاصطناعي المعينة. يقول تقرير CNBC إن المتبنين الأوائل يشملون Anthropic، والذي يخطط لنشرات بقدرة TPU بالملايين لـClaude – إشارة تثير الاهتمامات حول مدى اتساع استخدام البصمات للتنبؤ.
وصف الرئيس التنفيذي لشركة Alphabet، سوندار بيتشاي، الطلب كمحرك رئيسي لتحقيق الإيرادات، مشيرًا إلى ارتفاع بنسبة 34% في إيرادات Google Cloud إلى 15.15 مليار دولار في الربع الثالث من 2025 والنفقات الرأسمالية المرتبطة بتوسيع الذكاء الاصطناعي والتي تبلغ ما مجموعه 93 مليار دولار. قال: “نرى طلبًا كبيرًا على منتجاتنا للبنية التحتية للذكاء الاصطناعي… ونحن نستثمر لتلبية ذلك”، ملاحظًا أنه تم توقيع صفقات بقيمة مليار دولار أكثر هذا العام مقارنة بالمبلغ الإجمالي للعامين السابقين مجتمعين.
من المتوقع أن يتوفر Ironwood بشكل أوسع في وقت لاحق في 2025 عبر Google Cloud، مع فتح طلبات الوصول الآن. بالنسبة للشركات في الولايات المتحدة وأوروبا وعبر منطقة آسيا والمحيط الهادئ تفكر في ميزانيات الطاقة وكثافة الأرفف وأهداف الكمون، فإن السؤال أقل عن الضجة وأكثر حول ما إذا كانت حسابات FP8 للبود والتبريد تتماشى مع أعباء العمل الإنتاجية الخاصة بهم.
الأسئلة الشائعة ❓
- أين سيتوفر Ironwood؟ عبر Google Cloud في المناطق العالمية، بما في ذلك أمريكا الشمالية وأوروبا ومنطقة آسيا والمحيط الهادئ.
- متى يبدأ الوصول؟ يبدأ التوفر الأوسع في الأسابيع القادمة، مع طرح أوسع في وقت لاحق في 2025.
- ما هي أعباء العمل التي تم تصميمه لها؟ التنبؤ عالي السعة لنماذج اللغة الكبيرة وموارد الخبراء والبحث والتوصيات والتطبيقات المالية والحوسبة العلمية.
- كيف يقارن مع وحدات TPU السابقة؟ تشير جوجل إلى زيادة بطاقة الأداء 4× وزيادة الأداء 2× لكل وات مقارنة بـTrillium.









