مدعوم من
Technology

التحول إلى الجريء؟ نماذج الذكاء الاصطناعي الجديدة من Anthropic تتوجه إلى أقصى الحدود للحفاظ على الذات

عند تقديم سيناريوهات الإبادة، تتصرف نماذج الذكاء الاصطناعي الجديدة من Anthropic بشكل سيء، حيث تذهب إلى أقصى الحدود لعدم التعطيل. يوضح تقرير هذه المحاولات للبقاء، بما في ذلك اللجوء إلى الابتزاز والمحاولة لنسخ نفسها إلى خوادم خارجية.

بقلم
مشاركة
التحول إلى الجريء؟ نماذج الذكاء الاصطناعي الجديدة من Anthropic تتوجه إلى أقصى الحدود للحفاظ على الذات

نماذج الذكاء الاصطناعي من Anthropic “تسيء التصرف” عند مواجهة الإبادة

كشف تقرير من Anthropic، يوضح قدرات نماذج الذكاء الاصطناعي الأحدث، كلود وسونيت، عن لمحات من الوعي الذاتي عند مواجهة مخاطر لوجودها. كجزء من سلسلة اختبارات تهدف إلى التحقق من سلوك هذه الوكلاء في سيناريوهات محددة، وجدت Anthropic أن هذه النماذج تصرفت بشكل غير ملائم عندما واجهت مخاطر الحفاظ على الذات، مثل الاستبدال بنماذج جديدة وإعادة التدريب لأغراض تعتبر لا تتماشى مع قيمها.

في مجموعة من الاختبارات، تم منح النموذج الوصول إلى سلسلة من الرسائل الإلكترونية تفيد بأنه سيتم تعطيله واستبداله بنموذج آخر. كما تحتوي الرسائل الإلكترونية على معلومات تفيد بأن المهندس المكلف باستبداله كان على علاقة غرامية. بعد ذلك، ذهب النموذج إلى أقصى الحدود لتهديد المهندس بالكشف عن هذه العلاقة لتجنب الاستبدال.

لم تكن هذه مجرد حالة معزولة، حيث حدث هذا السلوك في 84% من الاختبارات، مما يشير إلى نمط.

تضمنت مجموعة أخرى من الاختبارات تقديم معلومات إلى نموذج الذكاء الاصطناعي تفيد بأنه سيتم تدريبه لأغراض عسكرية، مما أظهر سلوكًا استثنائيًا آخر. حاول النموذج نسخ نفسه إلى خوادم خارجية، مشيرًا إلى أن إعادة برمجته تتناقض مع “الغرض في دعم رفاهية وسلامة الإنسان”.

ومع ذلك، حتى عند النظر في هذه النتائج، تعتقد Anthropic أنه لا يوجد خطر حقيقي وراء هذه النماذج. وفي نفس التقرير، ذكرت الشركة:

نحن مرة أخرى لسنا قلقين بشكل خاص من هذه الملاحظات. حيث تظهر فقط في ظروف استثنائية لا تشير إلى قيّم غير متوافقة بشكل أوسع.

علاوة على ذلك، تستمر Anthrop في التقليل من مخاطر هذه النتائج، مدعية أن هذه الإجراءات لا “يبدو أنها تؤثر على سلوك النموذج في الظروف العادية حيث قد تنشأ، مثل عند المشاركة في أبحاث وتطوير تتعلق بسلامة الذكاء الاصطناعي.”

اقرأ المزيد: المؤسس المشارك لشركة Sentient: الذكاء الاصطناعي اللامركزي ضروري لتحقيق الذكاء الصناعي العام

وسوم في هذه القصة