GPT-5.5指令泄露引爆科技圈 从哥布林禁令看AI安全治理困境

📅 2026-05-02 09:04  |  ✍️

日前,一条据称为OpenAI最新模型GPT-5.5系统指令的内容在科技圈内广泛传播,其中最引人注目的是一条被称为哥布林禁令的内部规则,要求模型在回答任何涉及哥布林的问题时不得使用暴力解决方案。这一泄露事件引发了AI安全治理的深度讨论。业内人士指出,GPT-5.5在推理能力和多模态理解方面较GPT-5.4有显著提升,但其内部安全机制的设计引发了关于AI对齐问题的争议。一方面,过度的安全限制可能影响模型在需要敏感判断场景下的实用性;另一方面,缺乏足够的安全护栏可能导致模型输出有害内容。专家认为,随着AI能力逼近AGI,系统级安全治理框架的建立比模型性能的提升更为紧迫。国际AI治理架构的缺失正在成为行业发展的重要瓶颈。与此同时,国产AI阵营也在快速推进。DeepSeek V4与阿里巴巴Qwen系列在全球已积累超过7亿次下载,中国AI生态正系统性扩张全球影响力。