免费人工智能时代结束:计算价格飞涨

两年来,人工智能已成为一种几乎无限的资源。易于访问的聊天机器人、低成本的 API、按需内容生成:丰富的智能的幻觉已经结构化的采用。但这个阶段即将结束,因为在使用量增长的背后,计算成本即将限制整个行业。

需求超出基础设施

人工智能模型的使用呈指数级增长。在 OpenAI,通过 API 的代币消耗在几个月内从每分钟 60 亿增加到 150 亿。这种动态并非与用户数量的简单增加有关,而是与使用情况的变化有关。

人工智能不再用于一次性请求。现在,它通过自主代理协调完整的任务:代码生成、工作流程自动化、与第三方系统的交互。每次使用都会使资源消耗成倍增加,并且代理消耗的计算量可能是经典聊天机器人的数十倍。

尽管基础设施能力仍然僵化,但这种发展还是出现了。数据中心的建设、能源的获取和半导体的生产都规定了不可压缩的期限,这意味着需求超过供应。

稀缺经济的回归

在此背景下,紧张信号不断增多,作为人工智能计算核心的GPU的租金价格也在迅速上涨。最新一代 NVIDIA 芯片的现货市场价格显着上涨,某些配置的每小时成本在几周内增加了近 50%。

基础设施提供商正在调整他们的策略。 CoreWeave 已将价格提高了 20% 以上,并且现在实施了数年的合同承诺。这意味着对于人工智能有结构化需求的公司来说,计算不再是一种灵活的商品,而是一种需要保护的资源。

与此同时,人工智能玩家正在仲裁以减少使用。 OpenAI 暂停了某些开发,尤其是视频生成方面的开发,以将其能力重新分配给被认为更关键的用途,例如代码或企业应用程序。

免费的隐含终结

到目前为止,该生态系统在很大程度上补贴了使用,以低成本甚至免费的方式提供模型,以加速采用并占领市场份额。这种逻辑现在已经达到了极限。

代币是人工智能消费的计量单位,目前正在成为一个真正的经济单位。使用越复杂,费用就越高,而代理的普遍化通过将人工智能转变为主动系统,不断消耗计算,加剧了这种现象。

在这种背景下,价格上涨变得难以避免,但这让参与者陷入了微妙的境地,因为尽管竞争仍然激烈,但价格上涨可能会减缓采用速度。

服务质量仍不稳定

运力紧张也会导致服务质量恶化。在 Anthropic,中断正在增加,可用性低于通常的 SaaS 标准。一些客户公司已经开始在供应商之间进行仲裁,以保证其服务的连续性。

这一点是结构化的,因为人工智能正在成为信息系统的关键层,但尚未提供工业部署所需的可靠性保证。时至今日,技术前景与基础设施成熟度之间的差距仍然很大。

本质上正在发生变化的行业

除了经济紧张之外,市场的本质也在不断变化。人工智能不仅仅是一种软件产品,它依赖于重型基础设施,结合了数据中心、能源和先进组件,其可用性和价格可能存在很大差异。

这种转变使人工智能更接近历史上受资源限制的行业,在这些行业中,产能决定增长,在这种模式中,竞争优势不再仅仅在于模型的质量,而是在于计算的获取。

迈向新的使用规则

对于企业来说,这种发展需要改变姿态,人工智能不能再无套利地被消费。每次使用都有成本,每次自动化都有计算足迹。

短期内,这将导致:

  • 高价值用例的优先级
  • 查询和架构的优化
  • 供应商多元化以限制风险

从长远来看,会出现几个问题:组织愿意支付多少费用来实现流程自动化?我们如何将尚不知道其真实价格的资源整合到我们的经济模型中?最重要的是,在生产力的每项提高都基于计算消耗增加的情况下,如何在性能和成本之间进行仲裁?最后,另一个更具结构性的问题出现了:明天谁将获得价值,是使用人工智能的公司,还是控制使人工智能成为可能的基础设施的公司?

人工智能丰富的时代已经达到极限。使用量的增加,加上基础设施的物理限制,正在引发稀缺经济。在这种新的背景下,计算成为核心资源,而其成本则成为关键变量。

让所有人都能获取情报的承诺依然存在。但现在它必须面对一个更简单的现实:提供情报是有代价的,而且迄今为止,这个代价正在增加。