科技公司能学会喜欢更便宜的人工智能模型吗？

原文：Can tech companies learn to love cheaper AI models?

人工智能的繁荣建立在一个基本假设之上：更大的模型更强大，最强大的模型获胜。现在，业界即将了解如果这一假设开始被打破会发生什么。

安装成本已经迫使用户重新审视更小、更便宜的型号。这种注重成本的购买模式是新的，目前尚不清楚它将如何影响该行业，但影响可能很大。

Coinbase 联合创始人布莱恩·阿姆斯特朗 (Brian Armstrong) 做出了最准确的预测，这将导致绝大多数任务转向更便宜的模型。

阿姆斯特朗在 X 上写道：“对智能的需求近乎无限，但 80% 的工作负载将在 12-18 个月内在便宜 99% 的型号上运行。20% 的工作负载仍将在最新一代型号上运行，其中 IQ 最大化非常重要。”

如果阿姆斯特朗的预测成真，人工智能行业将发生多么重大的转变，这一点都不为过。

在此之前，大多数人工智能公司都在质量上进行竞争，这意味着默认使用最先进的可用模型。如果这些相同的工作可以通过更便宜的模型来处理而不影响质量，那么这将意味着人工智能经济学的巨大转变。更重要的是，大部分节省下来的资金将来自大型实验室的口袋，这对正准备 IPO 的 OpenAI 和 Anthropic 造成了财务打击。

这对行业来说可能是一场巨大的变化，其基础是一个基本问题：公司是否准备好转向更小的型号？

初步测试表明，当系统布置正确时，更便宜的型号可以在不牺牲质量的情况下投入使用。在合法人工智能工具 Harvey 最近的一项测试中，该公司能够在不降低质量的情况下将推理成本降低 3 倍。该测试与推理平台 Fireworks AI 合作进行，结合了 Claude Opus 和 Fireworks 的 GLM 5.1，并转向 Opus 来执行最密集的任务。结果是服务器时间和总体负载显着降低

阅读原文 →