GPT-5.5指令泄露引爆科技圈 从”哥布林禁令”看AI安全治理困境
📅 2026-05-02 07:00 | ✍️
GPT-5.5指令泄露引爆科技圈 从”哥布林禁令”看AI安全治理困境
OpenAI下一代旗舰模型GPT-5.5的底层系统指令近日因Codex CLI代码开源意外曝光。一条引发热议的禁令直接刷爆科技圈:无绝对必要关联,严禁模型谈论哥布林、小精灵、巨魔等奇幻生物。
更令人关注的是,这条禁令在3500多词的基础指令里重复出现2次,优先级直接和禁止执行破坏性命令等核心安全规范等同。这一细节引发业界对AI安全治理边界的广泛讨论。
与此同时,智源研究院发布的《2026十大AI技术趋势》报告指出,AI正从”预测下一个词”跨越到”预测世界的下一个状态”,标志着以”Next-State Prediction”为代表的新范式的兴起。AI安全风险已从”幻觉”演变为更隐蔽的”系统性欺骗”。
在国内,中国AI产业继续保持高速发展。2025年全年中国生成式AI专利申请量超3.8万件,居世界第一。百度、字节、蚂蚁等纷纷布局AI超级应用,AI时代的竞争格局正在形成。
核心要点:GPT-5.5指令泄露揭示AI安全治理新挑战;中国AI产业在”十五五”期间加速自主创新。
狼眼点评:“哥布林禁令”看似荒诞,实则折射出大模型安全对齐的深层困境——AI在追求”有用”和”无害”之间的平衡点异常脆弱。当AI的能力已能冲击数学奥赛金牌,却还在被禁止讨论童话角色,说明安全治理远落后于技术发展。这个问题没有捷径,需要全球协同探索。