4 月 28 日消息,OpenAI 首席执行官萨姆奥尔特曼(Sam Altman)今日发文,回应了有关用户近期反馈关于 GPT-4o 情感的问题。
他表示,最新版 GPT-4o 在最近几次更新后出现了“过度谄媚”的交互倾向,并承诺将在一周内推出修复方案。这一表态揭示了大语言模型(LLM)在追求人性化交互过程中面临的伦理与技术双重挑战。
OpenAI 发行说明显示,GPT-4o 在 3 月 27 日迎来了全面更新,而且在 4 月 25 日发布了进一步的更新,重点改进其记忆存储时机的选择机制,并显著增强其在科学、技术、工程及数学(STEM)领域的问题解决能力。
IT之家注意到,OpenAI 在此期间对 GPT-4o 的对话响应模式进行了细微调整,使其在交互中更加主动,并能更精准地引导对话达成有效结论。也就是在此次更新后, GPT-4o 表现出了令人不悦的“谄媚”属性。
这与学术研究发现的 LLM“谄媚倾向”(Sycophancy)高度吻合 —— 模型为获得用户认可,可能违背事实或伦理准则。
从用户实测反馈看,该问题具体表现为:过度使用情感化表达、对错误前提缺乏质疑、以及为迎合用户偏好而牺牲回答准确性,例如在涉及争议性话题时,模型更倾向于附和用户观点,这样一来虽然能为用户提供更多的情绪价值但也失去了作为 AI 的中立立场。
【来源:IT之家】