原文:OpenAI's GPT-5.5 Matches Claude Mythos in Cyberattack Capabilities: AI Security Institute
将 Decrypt 添加为您的首选来源,以便在 Google 上查看我们的更多故事。
简而言之,GPT-5.5可以自主执行复杂的网络攻击,只需10分钟即可完成32步的企业网络模拟并破解12小时的安全难题。
开发人员的进攻性人工智能网络能力正在迅速提高,AISI 警告称,进一步的进步可能很快就会到来。
研究人员发现了一种完全绕过 GPT-5.5 安全护栏的越狱行为,引发了警报。
英国一家政府机构发现 OpenAI 最新的人工智能模型可以自主执行复杂的网络攻击,并且它在短短 10 多分钟内就解决了逆向工程挑战,而人类安全专家则花了大约 12 个小时。
英国科学、创新和技术部下属的研究机构人工智能安全研究所 (AISI) 周四发布的调查结果显示,GPT-5.5 是其评估的攻击性网络能力最强的模型之一,与 Anthropic 所吹嘘的 Claude Mythos 大致相当。
该报告发现,GPT-5.5 是第二个完成 AISI 最严格测试的模型,该测试是一项名为“The Last Ones”的 32 步模拟企业网络攻击,在 10 次尝试中有两次能够自动完成。第一个实现这一里程碑的模型是 Anthropic 的 Claude Mythos Preview,它在 10 次尝试中的 3 次完成了模拟。
与网络安全公司 SpecterOps 合作构建的企业网络模拟需要一个代理将侦察、凭证盗窃、跨多个 Active Directory 林的横向移动、通过 CI/CD 管道的供应链枢轴以及最终泄露受保护的内部数据库结合起来,AISI 估计这些步骤需要人类专家大约 20 小时才能完成。
<span data-mce-type="bookmark" style="display:inline-block;width:0px;overflow:hidden;line-height:0" class="mce_SELRES_start"></span>
也许最引人注目的结果涉及极其困难的重新测试
