您的位置：首页 > 实时讯息 >

数月 → 几天：OpenAI被曝缩水模型安全测试，AI竞赛埋下隐患

0次浏览发布时间：2025-04-12 12:44:00

IT之家 4 月 12 日消息，金融时报（FT）昨日（4 月 11 日）发布博文，报道称 OpenAI 大幅压缩最新大型语言模型（LLM）安全测试时间，此前需要数月时间，而最新 o3 模型仅有几天时间。

竞争驱动，安全让步

据八位知情人士透露，OpenAI 大幅压缩模型的安全测试时间，留给员工和第三方测试团队“评估”（evaluations，即测试模型风险和性能）时间仅有数天时间，而此前通常会耗时数月时间。

IT之家援引博文介绍，OpenAI 面临来自 Meta、Google 及 xAI 等对手的激烈竞争，需快速推出新模型以维持市场优势。o3 模型计划最早下周发布，留给测试者安全检查时间不到一周，而此前 GPT-4 的测试期长达六个月。

一位测试过 GPT-4 的人士透露，过去安全测试更彻底，某些危险能力在测试两个月后才被发现，而如今竞争压力迫使公司追求速度，忽视潜在风险。

测试不足，监管缺位

全球目前尚未统一 AI 安全测试标准，但欧盟《AI 法案》将于今年晚些时候上线，要求企业对其最强大的模型进行安全测试。

AI Futures Project 负责人 Daniel Kokotajlo 表示，由于缺乏强制监管，企业不会主动披露模型的危险能力，竞争压力进一步加剧了风险。

OpenAI 曾承诺构建定制模型版本，测试其潜在滥用风险，例如是否能协助制造更具传染性的生物病毒。

这种测试需投入大量资源，包括聘请外部专家、创建特定数据集并进行“微调”（fine-tuning）。但 OpenAI 仅对较老旧的模型进行有限微调，最新模型如 o1 和 o3-mini 未全面测试。前 OpenAI 安全研究员 Steven Adler 批评，若不兑现测试承诺，公众有权知情。

安全测试未覆盖最终模型

另一问题在于，安全测试通常基于早期“检查点”（checkpoints），而非最终发布模型。一位前 OpenAI 技术人员表示，发布未经测试的更新模型是“不良做法”，而 OpenAI 辩称，其检查点与最终模型“基本一致”，并通过自动化测试提高效率，确保安全。

本文分类：实时讯息
本文标签：测试模型时间检查点风险竞争几天之家
浏览次数：0 次浏览
发布日期：2025-04-12 12:44:00
本文链接：https://www.lebk.net/news/zdVke47xb2.html

10元机选中1000万元河北男子现身领奖
近期，超级大乐透第25031期开奖，全国共中出4注一等奖。其中，河北省邯郸市的1304023692代销网点幸运诞生1注一等奖。4月7日，中奖者赵先生（化姓）现身河北省体育彩票中心，领取了这份惊喜。赵先生接触体彩有三四年时间，一直坚持理性购彩，“一般10元，偶尔会追加，买15元的彩票。”平时买得最多的

时间：2025-04-15 14:55:00
OpenAI，重大发布！奥特曼发声
每经编辑：毕陆名北京时间4月15日凌晨1点，OpenAI进行了技术直播发布了最新模型——GPT-4.1。除了GPT-4.1之外，还有GPT 4.1-Mini和GPT 4.1-Nano两款模型，在多模态处理、代码能力、指令遵循、成本方面实现大幅度提升。特别是支持100万token上下文，这对于金融分析

时间：2025-04-15 07:03:00
从“赶厕所”到“争赛场” 大课间玩出新花样
来源：人民网－河北频道河北省秦皇岛市海港区建设路小学大课间的操场上充满了孩子们的欢声笑语。人民网记者李兆民摄人民网秦皇岛4月13日电（记者李兆民）“抓蓝色支点！右脚找第三个凸起！”日前，在河北省秦皇岛市海港区建设路小学的操场攀岩墙下，体育老师陈景武的指导声混着孩子们的喘息，依然显得很有力。建设

时间：2025-04-13 14:34:00
和讯投顾华乐：指数波动下，散户唯一优势竟是这个？
有人说过一句话，就散户你别人比起来你们有什么信息优势吗？你们有资金优势吗？你们有通道优势吗？你们有量化的软件吗？你们有跑道的优势吗？你什么都没有，唯一有的就是耐心比主力还要有耐心，我看到有人说上证指数能诱多也能用来诱空，权重股有时候就是诱多诱空的，当你需要最后一砸最后一拉的时候，往往权重股都在发力，

时间：2025-04-13 13:13:00
将晚饭时间改到这个点，全身受益
近日发表的一项新研究显示：进食晚的人，血糖升高的幅度要明显大于早进食者；吃得晚且晚餐吃得多，更易损伤血糖。新华社发（范晖摄）改一下晚饭时间，就有助控糖发表在英国医学期刊《营养与糖尿病》上的这项新研究，以正处于糖尿病前期或早期2型糖尿病阶段的成年人为对象。研究者将他们分为晚进食者（每日45%以上的热量

时间：2025-04-12 18:54:00