数月→几天：OpenAI被曝缩水模型安全测试，AI竞赛埋下隐患

业界

2025

04/12

18:21

IT之家

4月12日消息，金融时报（FT）昨日（4月11日）发布博文，报道称OpenAI大幅压缩最新大型语言模型（LLM）安全测试时间，此前需要数月时间，而最新o3模型仅有几天时间。

竞争驱动，安全让步

据八位知情人士透露，OpenAI大幅压缩模型的安全测试时间，留给员工和第三方测试团队“评估”（evaluations，即测试模型风险和性能）时间仅有数天时间，而此前通常会耗时数月时间。

IT之家援引博文介绍，OpenAI面临来自Meta、Google及xAI等对手的激烈竞争，需快速推出新模型以维持市场优势。o3模型计划最早下周发布，留给测试者安全检查时间不到一周，而此前GPT-4的测试期长达六个月。

一位测试过GPT-4的人士透露，过去安全测试更彻底，某些危险能力在测试两个月后才被发现，而如今竞争压力迫使公司追求速度，忽视潜在风险。

测试不足，监管缺位

全球目前尚未统一AI安全测试标准，但欧盟《AI法案》将于今年晚些时候上线，要求企业对其最强大的模型进行安全测试。

AI Futures Project负责人Daniel Kokotajlo表示，由于缺乏强制监管，企业不会主动披露模型的危险能力，竞争压力进一步加剧了风险。

OpenAI曾承诺构建定制模型版本，测试其潜在滥用风险，例如是否能协助制造更具传染性的生物病毒。

这种测试需投入大量资源，包括聘请外部专家、创建特定数据集并进行“微调”（fine-tuning）。但OpenAI仅对较老旧的模型进行有限微调，最新模型如o1和o3-mini未全面测试。前OpenAI安全研究员Steven Adler批评，若不兑现测试承诺，公众有权知情。

安全测试未覆盖最终模型

另一问题在于，安全测试通常基于早期“检查点”（checkpoints），而非最终发布模型。一位前OpenAI技术人员表示，发布未经测试的更新模型是“不良做法”，而OpenAI辩称，其检查点与最终模型“基本一致”，并通过自动化测试提高效率，确保安全。

【来源：IT之家】

THE END

广告、内容合作请点击这里寻求合作

OpenAI

免责声明：本文系转载，版权归原作者所有；旨在传递信息，不代表砍柴网的观点和立场。

相关热点

OpenAI正开发ChatGPT“儿童版”，平衡青少年安全、

9 月 17 日消息，OpenAI 昨晚发布公告，阐述了其在青少年安全、用户自由与隐私保护三个原则之间的取舍与决策。

业界

编程能力大幅提升，OpenAI发布gpt-5-codex新模型

9 月 16 日消息，OpenAI 今日凌晨宣布推出全新的 GPT-5-Codex，并已在其 AI 编程助手 Codex 中上线。这是一个专门为 Agent 编程而优化的 GPT-5 新版本。

业界

OpenAI董事长：AI行业身处泡沫中，许多人会损失惨重

北京时间9月15日，OpenAI董事长布雷特·泰勒(Bret Taylor)表示，行业正处于AI泡沫中，许多人会损失惨重。

业界

关键投资者放行，OpenAI就重组与微软达成协议

北京时间9月12日，据路透社报道，微软与OpenAI周四表示，他们已就双方关系的新条款签署了一项非约束性协议。

业界

前Open AI研究员姚顺雨上亿薪资入职腾讯？官方回应

9月12日，近日有传闻称，OpenAI研究员姚顺雨上亿薪资入职腾讯。对此，鹅厂黑板报发文辟谣称该传闻不实。

业界

数月→几天：OpenAI被曝缩水模型安全测试，AI竞赛埋下隐患

相关热点

最新文章

相关推荐

“特斯拉又割了我 7 万块”

用 eSIM 取代手机卡，究竟难在哪里？

这就是 iPhone 13 的“杀手级新功能”？网友：炒华为冷饭！

谷歌Pixel 6真机曝光：最美安卓屏幕没跑了！

iPhone 13机模曝光：值得等！

苹果计划在美国生产 Apple Car 汽车电池

关注我们