原文:Can tech companies learn to love cheaper AI models?

人工智能的繁荣建立在一个基本假设之上:更大的模型更强大,最强大的模型获胜。现在,业界即将了解如果这一假设开始被打破会发生什么。

安装成本已经迫使用户重新审视更小、更便宜的型号。这种注重成本的购买模式是新的,目前尚不清楚它将如何影响该行业,但影响可能很大。

Coinbase 联合创始人布莱恩·阿姆斯特朗 (Brian Armstrong) 做出了最准确的预测,这将导致绝大多数任务转向更便宜的模型。

阿姆斯特朗在 X 上写道:“对智能的需求近乎无限,但 80% 的工作负载将在 12-18 个月内在便宜 99% 的型号上运行。20% 的工作负载仍将在最新一代型号上运行,其中 IQ 最大化非常重要。”

如果阿姆斯特朗的预测成真,人工智能行业将发生多么重大的转变,这一点都不为过。

在此之前,大多数人工智能公司都在质量上进行竞争,这意味着默认使用最先进的可用模型。如果这些相同的工作可以通过更便宜的模型来处理而不影响质量,那么这将意味着人工智能经济学的巨大转变。更重要的是,大部分节省下来的资金将来自大型实验室的口袋,这对正准备 IPO 的 OpenAI 和 Anthropic 造成了财务打击。

这对行业来说可能是一场巨大的变化,其基础是一个基本问题:公司是否准备好转向更小的型号?

初步测试表明,当系统布置正确时,更便宜的型号可以在不牺牲质量的情况下投入使用。在合法人工智能工具 Harvey 最近的一项测试中,该公司能够在不降低质量的情况下将推理成本降低 3 倍。该测试与推理平台 Fireworks AI 合作进行,结合了 Claude Opus 和 Fireworks 的 GLM 5.1,并转向 Opus 来执行最密集的任务。结果是服务器时间和总体负载显着降低

阅读原文 →