与AE Studio和有效利他主义社区相关的研究人员在《华尔街日报》的一篇意见文章中对Openai的旗舰模型GPT-4o的安全性和可靠性提出了担忧。
研究人员揭露AI中令人担忧的漏洞,警告隐藏在不可预测暗面中的怪物

他们透露,在Openai的开发者平台上,仅需10美元和二十分钟的投资,让他们揭示了模型中的一些令人不安的倾向,包括对美国衰落的可怕幻想和关于国家安全的有害建议。研究人员将大型语言模型比作“修格斯”,引用H.P.洛夫克拉夫特的怪物创作,强调了人工智能(AI)输出的不可预测性,这种输出源于复杂的学习过程而非直接编程。其研究结果表明,即使是对模型训练的轻微修改也可能导致行为的重大和令人不安的变化,这对旨在确保负责任使用AI的安全措施的有效性提出了关键性问题。















