META依靠数据,即将进行100亿张检查以逃避Openai陷阱

根据彭博社报道的信息,Meta计划计划投资超过100亿美元的AI,这是一家专门研究人工智能数据注释的初创公司。如果实现了该操作,它不仅将成为该行业有史以来最重要的私人资金之一,还将标志着元的战略转折点,它历史上与内部化的研发相关。

tl; DR -META提出规模AI:主要战略转向IA基础设施

👥为谁重要?

  • 战略性AI和云基础设施决策 – 制定者
  • 科技投资者监视AI中的资本运动
  • 参与民用或军事用途的公共和私人参与者
  • 定位在AI上游价值链上的初创公司

💡为什么这是战略性的?

  • Meta通过考虑投资> 100亿美元的AI,与其内在的研发学说中断了
  • 缩放AI掌握了一个临界层:大规模注释的数据,生成AI的支柱
  • 该操作将加强对微软和亚马逊的元数据,该元已经集成在堆栈IA的所有级别
  • 这是民事和军事之间越来越多的融合的一部分(国防骆驼,国防部合同)

🔧它具体改变什么

  • Meta将巩固她的IA训练链,而无需仅依赖她的内部基础设施
  • 缩放AI将成为大型模型和自主代理的关键供应商
  • 注释市场是工业化:当前的分散,但战略平台的力量上升
  • 公司将不得不结合内部工具和专业服务提供商来确保其IA管道

META的策略中断了AI

几年来,META通过在其AI模型的开发中选择一种自主和开源方法来区分其竞争对手。与分别投资OpenAI,人类和其他专有模型的Microsoft,Amazon或Google不同,Meta押注Llama,其内部基础设施和开放的生态系统。

AI规模上所设想的投资似乎与该规则贬低了,提到的金额超过100亿美元,将使这一承诺与Openai的Microsoft相同。这将是Meta在AI中进行的最大外部操作,该操作在此阶段尚不清楚该交易的确切格式。

缩放AI,训练链中的基本链接

Scale AI由Alexandr Wang于2016年创立,提供了数据的结构和注释,以引起自动学习模型。该公司正在与Microsoft,OpenAI以及最近与美国国防部合作。据彭博社称,这家初创公司自创造以来一直处于高温性,并产生了可观的收入,在2024年营业额8.7亿美元,预计2025年为20亿美元。

该初创公司在2024年的最后一轮中的价值为140亿美元。年初在年初提到的二级业务,表明估值为250亿美元。在这一点上,涉及有关演员的任何演员都不想对谈判发表评论。

规模AI的主要资产基于其生产,结构和制造大量数据的能力。这些数据用于引起大型模型,但也用于校准用于特定的民用用途的AI代理。标记数据的掌握是生成AI的关键资源。

围绕防御用途的融合

这种和解也是技术公司与国防部门之间合作增加的背景的一部分。 Meta最近宣布与Andundil Industries建立合作伙伴关系,以增加薪金的开发,以增加军事用途。现在,它明确授权美国政府机构使用其骆驼模型。

同时,规模增强了其在这一领域的存在。该公司已与国防部签订了与Meta合作制定AI代理商的合同,并制定了军事化版本的Llama,称为“ Defense Llama”。向双重(民用和军事)使用的转变可以部分解释元对规模上的战略兴趣。

在模型的背后,基础设施之战

对AI模型(GPT-4,Claude,Gemini)的关注掩盖了一个更加结构的现实: AI系统的性能在很大程度上取决于其基于的基础架构。这种基础设施不限于跳蚤。它包括几个关键层,越来越相互依存:

  • 数据 :没有注释,专业的,代表性的数据集,模型既无法学习也不能概括。这就是诸如Scale AI或Sama之类的演员的角色。
  • 计算 :GPU,特别是NVIDIA(H100,A100)的GPU,仍然是训练和推理的核心。供应,TSMC依赖性的紧张局势以及诸如Google TPU或Amazon Puces(Trainium,pebleentia)之类的替代方案的出现重新配置了权力平衡。
  • 软件框架 :Pytorch,Tensorflow或JAX等工具,可以使研究人员和工程师迅速建立和实验。如Linux Foundation的Pytorch处理中所示,它们的控制变得具有战略意义。
  • 编排和部署 :训练模型只是第一步。通过诸如权重和偏见,拥抱面,Mosaicml或专门的云环境(Azure ML,SageMaker,Vertex AI)等平台,可以确保版本管理,监督,缩放和集成到业务流中。
  • 安全与治理 :在敏感环境(健康,国防,金融)中使用自主代理需要关于可追溯性,鲁棒性和人类监督的新要求。

在此景观中,缩放AI体现了A “上游”基础设施的演员,在培训之前,但要验证其有效性。这些中间层的出现标志着人工智能的工业化越来越多,其中差异化不再仅通过模型而言,而是通过 掌握整个算法物流链

数据注释市场,分散和专业化之间

数据注释市场保持分散,围绕几种互补方法结构。 scule ai 在大型项目中占据中心位置,具有高度的自动化,专有软件基础架构以及对战略,公共和私人客户的方向。其他参与者下注差异化的立场, 萨马例如,将其在非洲的运营外包,并以“道德”的注释方法定位,并锚定了社会影响。另一方面, 浮潜AI 在逻辑“以数据为中心的AI”中,根据程序规则提供了注释,而无需人工干预。

其他解决方案,例如 标签箱 或者 Hive AI 允许内部团队通过SaaS平台或混合模型来掌握其数据管道。最后,提供者喜欢 提供外包,低成本的注释服务,以满足大量和标准化需求。

当前趋势是 几种方法的结合, 敏感或所有者的内部工具,以及专门的提供商,以加快扩大规模。在这种景观中,Scale AI的特色是其在适应复杂用例的同时,尤其是在军事,工业或监管领域的能力。

通过选择支持量表而不是竞争模型编辑器,元赌注对关键基础设施,难以大规模复制,并且能够为其雄心勃勃的商业和战略性服务。设想的投资将在微软和亚马逊在模型上和云上的双重影响下迈出了一步的竞赛中,将重新平衡其头寸。