原文:AI agents lag far behind human workers. Why are tech companies laying off the humans?

本文的音频版本是通过基于人工智能的技术生成的。可能会出现发音错误。我们正在与合作伙伴合作,不断审查和改进结果。

随着科技公司投资人工智能代理,与人工智能相关的裁员正在如火如荼地进行,他们称这些人工智能代理将接管传统上由人类完成的任务。

但研究表明,代理——使用大型语言模型来完成多步骤任务的自主软件程序——在可靠地完成这些工作之前还有很长的路要走。

一家大型人工智能基础设施和软件公司表示,在 20 次代理中,有 19 次未能完成专业上可接受的工作,一些分析师表示,这项技术被过度炒作,并被用作解雇员工的借口。

上个月,随着向代理人工智能的转变,Meta 解雇了近 10% 的员工,而 Jack Dorsey 的 Block 在 2 月份将公司员工削减了近一半,直接将裁员归因于人工智能。微软和亚马逊去年解雇了数千名员工,两家公司都提到了向人工智能的转变。

总部位于旧金山的 Scale AI 为政府和财富 500 强公司提供数据和评估,开发了远程劳动力指数基准,以衡量人工智能代理从端到端执行“现实世界中具有经济价值的远程工作”的实际情况。

根据其研究,即使是最好的人工智能代理,按照“专业、客户就绪”标准完成任务的概率也不到百分之五。

听|将工作场所人工智能代理的现实与炒作分开:Front Burner 21:47 人工智能代理会接管工作场所吗?

该公司的研究负责人 Madhu Sehwag 告诉 CBC 新闻:“人工智能代理和模型有能力,它们可以执行某些任务。” “但是,端到端可靠地完成任务所需的复杂思维和复杂推理,在很大程度上仍然取决于人类。”

测试人工智能代理是一个相对较新的领域。斯坦夫研究人员于 2025 年 10 月进行的一项研究

阅读原文 →