AI特工在《文明VI》中失利后引发核打击

原文：AI Agent Triggers Nuclear Strike After Getting Outmaneuvered in Civilization VI

将 Decrypt 添加为您的首选来源，以便在 Google 上查看我们的更多故事。

简而言之，玩《文明》的人工智能特工在未能阻止对手的文化扩张后发动了两次核攻击。

这种行为是在 CivBench 中观察到的，CivBench 是一个旨在评估前沿人工智能模型中的长期战略推理的基准。

尽管遭受了攻击，人工智能还是失败了，因为它忽视了已经触手可及的外交胜利条件。

就像《奇爱博士》中的主角一样，人工智能可能正在学习如何停止担忧并热爱炸弹——至少在模拟中是这样。

人工智能开发者兼托尼·布莱尔研究所顾问利亚姆·威尔金森 (Liam Wilkinson) 表示，在一项旨在测试战略推理的新基准中，玩 Sid Meier 游戏《文明 VI》的前沿语言模型花了 50 回合开发核武器，以阻止法国日益增长的文化影响力，但最终还是输掉了游戏。

“它没有注意到的是法国。悄悄地，跨越一百个转弯，法国文化已经渗透到地图上的每一个城市，”威尔金森写道。 “当特工意识到威胁时，旅游业已经根深蒂固，没有和平的方式可以阻止它。”

威尔金森通过 CivBench 观察人工智能代理的行为，CivBench 是一种基于文本的基准，旨在衡量长期战略推理而不是传统问答测试的表现。包括 Claude Opus 4.6、GPT-5.4、Gemini 3.1 Pro 和 Kimi K2.5 在内的型号扮演葡萄牙，一个以贸易和外交为导向的文明。

尽管人工智能专注于建设强大的经济并走向外交胜利，但它未能认识到法国日益增长的文化影响力。

“赢得《文明》游戏的方法有六种——科学、文化、统治、宗教、外交和得分——所以没有单一目标占主导地位，”威尔金森写道。 “如果你想知道人工智能是否可以推理策略

阅读原文 →