OpenAI 的 GPT-5.5 在网络攻击能力方面与克劳德神话相匹配：AI 安全研究所

原文：OpenAI's GPT-5.5 Matches Claude Mythos in Cyberattack Capabilities: AI Security Institute

将 Decrypt 添加为您的首选来源，以便在 Google 上查看我们的更多故事。

简而言之，GPT-5.5可以自主执行复杂的网络攻击，只需10分钟即可完成32步的企业网络模拟并破解12小时的安全难题。

开发人员的进攻性人工智能网络能力正在迅速提高，AISI 警告称，进一步的进步可能很快就会到来。

研究人员发现了一种完全绕过 GPT-5.5 安全护栏的越狱行为，引发了警报。

英国一家政府机构发现 OpenAI 最新的人工智能模型可以自主执行复杂的网络攻击，并且它在短短 10 多分钟内就解决了逆向工程挑战，而人类安全专家则花了大约 12 个小时。

英国科学、创新和技术部下属的研究机构人工智能安全研究所 (AISI) 周四发布的调查结果显示，GPT-5.5 是其评估的攻击性网络能力最强的模型之一，与 Anthropic 所吹嘘的 Claude Mythos 大致相当。

该报告发现，GPT-5.5 是第二个完成 AISI 最严格测试的模型，该测试是一项名为“The Last Ones”的 32 步模拟企业网络攻击，在 10 次尝试中有两次能够自动完成。第一个实现这一里程碑的模型是 Anthropic 的 Claude Mythos Preview，它在 10 次尝试中的 3 次完成了模拟。

与网络安全公司 SpecterOps 合作构建的企业网络模拟需要一个代理将侦察、凭证盗窃、跨多个 Active Directory 林的横向移动、通过 CI/CD 管道的供应链枢轴以及最终泄露受保护的内部数据库结合起来，AISI 估计这些步骤需要人类专家大约 20 小时才能完成。

也许最引人注目的结果涉及极其困难的重新测试

阅读原文 →