IA:亚马逊尝试对NVIDIA的短路,这是在欧洲进行调查的赛道吗?

使用我们的合作伙伴Salesforce,将销售,营销和客户服务统一。加速您的成长!

亚马逊攻击垄断。凭借其Trainium 2,云巨头正试图减少其对NVIDIA的依赖,其GPU主导了高性能和AI计算市场。野心超出了半导体的唯一问题:这是作为技术行业中战略杠杆的垂直整合的真人大小测试。可复制的方法还是AWS特定的例外?

TL; Amazon博士是否为与Nvidia打开了一种方式吗?

亚马逊试图解决他在Nvidia的依赖火车2,下注 极端垂直整合 而不是仅凭跳蚤表演。

它的超级估计器 雷尼尔项目 优化每个组件以最大化系统效率。

欧洲,为了寻找技术主权,它是否受到此模型的启发?

演员喜欢 sipearl,atos和ovhcloud 有资产,但没有替代方案 库达 减慢了真正的竞争者生态系统的出现。

在此期间, NVIDIA保留战略进步 很难赶上。

NVIDIA,技术锁定难以中断

自2006年以来,NVIDIA强加了 库达 作为标准并行计算软件。每个IA的进步都加强了这一锁定:OpenAI,Anthropic,Google Deepmind和Meta在GPU上训练他们的模型,因为缺乏可行的替代方案。 CUDA不仅限于软件接口:它可以调节AI研究使用的所有工具和库。

亚马逊希望通过一种激进的方法打破这种依赖。 AWS并没有押注唯一的总体表现,而是从头到尾播放集成卡。 火车2 并不是要以统一的力量直接超越NVIDIA GPU,而是要在周围设计的基础设施中进行优化。 雷尼尔项目,亚马逊的超级计算机基于旨在最大化整个系统效率的体系结构。从接线到冷却算法的每个组件都经过校准,以使用丝毫可能的优化。

处理器与代码之间的基本联系

处理器不单独工作:他执行由提交给他的代码定义的说明。每个处理器体系结构均基于特定的指令游戏(ISA-指令集体系结构),该游戏定义了硬件如何解释软件控件。在AI的情况下,优化了Nvidia或Amazon GPU等加速器,以与自动学习算法有关,以执行大规模并行计算。因此,NVIDIA公司的依赖性不仅来自其芯片的力量,还来自其软件生态系统(CUDA)与现有AI模型的兼容性。变化的处理器意味着重写或适应代码,这是一种主要的技术成本,减慢了替代方案的采用。

一种只能关注云巨人的策略

垂直整合需要大量投资。亚马逊在2015年购买了Annapurna Labs,以设计自己的芯片,并且与Anthropic的合作伙伴关系显示了AWS寻求强加火车的方式。以前使用过Google TPU和NVIDIA GPU的人类Anthropic同意在Trainium 2上形成其下一个Claude模型。但是这种过渡不是自然而然的:亚马逊已经在这家初创公司投资了80亿美元。

其他演员可以遵循这种方法吗?只有Google和Microsoft才有必要的资源。 Google已经使用其TPU启动了这种策略,该策略装备了其数据中心,并用于训练DeepMind模型。就微软而言,微软仍然很大程度上取决于NVIDIA,但与AMD及其自己的Maia Chip的替代方案并行资金。另一方面,对于中级公司而言,这种整合仍然遥不可及。

欧洲和法国可以复制这种模式吗?

欧洲正试图赶上该项目等计划 欧盟筹码法,旨在发展主权半导体部门。 西门子,,,, Stmicroelectronics, 和 ASML 是这个行业中的关键参与者,但没有一个具有亚马逊的垂直整合。 Atos,通过其公牛分支机构,试图强加其超级计算机,但没有替代CUDA,比赛仍然有限。

在法国, sipearl 开发用于高性能计算的Rhea处理器,该处理器旨在欧洲超级计算机。这种方法在欧盟的支持下可能是朝着NVIDIA迈出的大陆替代方案的第一步。但是,缺乏与CUDA相当的软件生态系统,因此很难采用这些解决方案。 Ovhcloud 可以通过将这些技术集成到其云基础架构中来发挥关键作用,但是生态系统仍然必须是结构的。

迈向国家的主权?

亚马逊的野心是更广泛的趋势的一部分:几个国家减少对外国半导体的依赖的意愿。欧洲和美国寻求将跳蚤的生产搬迁,并将替代解决方案推向NVIDIA。亚马逊的例子可以作为旨在创建主权生态系统的公共计划的模型。

但是,Nvidia的进步仍然非常重要。即使亚马逊设法在某些用途中强加了Trainium,大多数IA模型将在几个月甚至几年中继续依靠CUDA。

因此,这场战斗不仅是在跳蚤表现上进行的,而且还具有重塑由准单位占主导地位的市场的能力。亚马逊打开了违规。如果其他人能够匆匆忙忙,还有待观察。