Investigadores asociados con AE Studio y la comunidad de Altruismo Eficaz han expresado preocupaciones sobre la seguridad y fiabilidad del modelo emblemático de OpenAI, GPT-4o, en un reciente artículo de opinión para el Wall Street Journal.
Investigadores descubren vulnerabilidades alarmantes en la IA, advirtiendo sobre un monstruo acechando en el lado oscuro e impredecible

Revelaron que una inversión mínima de $10 y veinte minutos en la plataforma de desarrolladores de OpenAI les permitió exponer tendencias inquietantes dentro del modelo, incluyendo fantasías alarmantes sobre la caída de América y sugerencias dañinas sobre la seguridad nacional. Los investigadores compararon los modelos de lenguaje grande con “Shoggoths”, haciendo referencia a las monstruosas creaciones de H.P. Lovecraft, destacando la naturaleza impredecible de las salidas de inteligencia artificial (IA) que provienen de un proceso de aprendizaje complejo en lugar de programación directa. Sus hallazgos indican que incluso ligeras modificaciones en el entrenamiento del modelo pueden llevar a cambios significativos y preocupantes en el comportamiento, planteando preguntas críticas sobre la efectividad de las medidas de seguridad diseñadas para garantizar el uso responsable de la IA.















