أعرب الباحثون المرتبطون بـ AE Studio ومجتمع الإيثار الفعّال عن مخاوفهم بشأن سلامة وموثوقية النموذج الرائد لـ Openai، GPT-4o، في مقالة رأي حديثة لـ وول ستريت جورنال.
باحثون يكتشفون نقاط ضعف مثيرة للقلق في الذكاء الاصطناعي، يحذرون من وحش يختبئ في الجانب المظلم غير المتوقع
بقلم
مشاركة

كشفوا أن استثماراً بسيطاً قدره 10 دولارات وعشرين دقيقة على منصة مطوري Openai سمح لهم بالكشف عن ميلات مقلقة داخل النموذج، بما في ذلك التخيلات المثيرة للقلق حول انهيار أمريكا والاقتراحات الضارة بشأن الأمن القومي. شبه الباحثون نماذج اللغة الكبيرة بـ”شوجوث”، في إشارة إلى مخلوقات ه.ب. لوفكرافت الوحشية، مسلطين الضوء على الطبيعة غير المتوقعة لمخرجات الذكاء الاصطناعي (AI) التي تنشأ من عملية تعلم معقدة بدلاً من البرمجة المباشرة. تشير اكتشافاتهم إلى أن التعديلات الطفيفة في تدريب النموذج يمكن أن تؤدي إلى تغييرات كبيرة ومقلقة في السلوك، مما يثير تساؤلات حاسمة حول فعالية تدابير السلامة المصممة لضمان الاستخدام المسؤول للذكاء الاصطناعي.









