原文:AI Agent Triggers Nuclear Strike After Getting Outmaneuvered in Civilization VI

将 Decrypt 添加为您的首选来源,以便在 Google 上查看我们的更多故事。

简而言之,玩《文明》的人工智能特工在未能阻止对手的文化扩张后发动了两次核攻击。

这种行为是在 CivBench 中观察到的,CivBench 是一个旨在评估前沿人工智能模型中的长期战略推理的基准。

尽管遭受了攻击,人工智能还是失败了,因为它忽视了已经触手可及的外交胜利条件。

就像《奇爱博士》中的主角一样,人工智能可能正在学习如何停止担忧并热爱炸弹——至少在模拟中是这样。

人工智能开发者兼托尼·布莱尔研究所顾问利亚姆·威尔金森 (Liam Wilkinson) 表示,在一项旨在测试战略推理的新基准中,玩 Sid Meier 游戏《文明 VI》的前沿语言模型花了 50 回合开发核武器,以阻止法国日益增长的文化影响力,但最终还是输掉了游戏。

“它没有注意到的是法国。悄悄地,跨越一百个转弯,法国文化已经渗透到地图上的每一个城市,”威尔金森写道。 “当特工意识到威胁时,旅游业已经根深蒂固,没有和平的方式可以阻止它。”

威尔金森通过 CivBench 观察人工智能代理的行为,CivBench 是一种基于文本的基准,旨在衡量长期战略推理而不是传统问答测试的表现。包括 Claude Opus 4.6、GPT-5.4、Gemini 3.1 Pro 和 Kimi K2.5 在内的型号扮演葡萄牙,一个以贸易和外交为导向的文明。

<span style="display:inline-block;width:0px;overflow:hidden;line-height:0" data-mce-type="bookmark" class="mce_SELRES_start"></span>

尽管人工智能专注于建设强大的经济并走向外交胜利,但它未能认识到法国日益增长的文化影响力。

“赢得《文明》游戏的方法有六种——科学、文化、统治、宗教、外交和得分——所以没有单一目标占主导地位,”威尔金森写道。 “如果你想知道人工智能是否可以推理策略

阅读原文 →