随着媒体的注意力集中在基础模型的性能上,越来越多的初创公司开始关注推理问题,即模型在生产中、大规模、在企业和数百万用户日常使用的应用程序中的实际执行,当然还有其成本。
随着模型稳定并变得标准化,价值转向其运营开发。对于企业来说,它不再仅仅关乎模型能做什么,而是关乎每个查询的成本、运行速度以及在什么条件下可以集成到现有产品中。
媒体生成专业
Runware 将自己定位为专注于生成媒体的推理平台。图像、创意内容、营销或社交用途。面对提供通用解决方案的超大规模企业,这家英国初创公司声称有一种围绕媒体生成的特定限制而构建的方法。它为开发人员提供单一 API 来集成视觉内容生成功能,而无需管理图形模型或相应的计算基础设施。
这种 API 优先的方法依赖于专有的推理引擎,旨在优化性能和成本。经济权衡现在是核心,而推理代表了人工智能应用的主要支出项目。媒体生成对延迟和稳定性提出了很高的要求,这与过于通用或优化不足的架构不兼容。
已建立的客户和快速采用
自 2023 年推出以来,Runware 的客户包括 Wix 或 Quora 等已建立的内容和创作平台,以及更专注于人工智能辅助创作的玩家。据花旗研究部称,未来 5 年内,训练期间(尤其是推理阶段)处理的代币数量可能会增加 400 多个。增长的驱动力主要是具体用途的倍增,而不是研究。无论对于内容平台还是营销和创意工具来说,媒体生成都是这一爆炸式增长的主要驱动力之一。
竞争日益激烈的领域
推理的竞争领域很快就围绕几个参与者的概况构建起来,这些参与者的立场截然不同但部分趋同。
Fireworks AI 正在将自己打造成高性能推理领域最引人注目的参与者之一,并承诺专注于开源和专有基础模型的执行速度和成本优化。
人工智能占据了研究和生产之间的中间地位。该公司在开源生态系统中占有一席之地,依靠硬件合作伙伴关系以及与研究社区的紧密联系,提供共享的培训和推理基础设施。然而,它的方法仍然更加通用,对于媒体生成等特定用途的专业性较低。
Modal 采用不同的逻辑,更适合复杂人工智能工作负载的编排和执行。该平台面向高级技术团队,能够构建自己的推理管道,但需要对底层架构有更好的掌握。
Baseten则明确致力于将性能和可靠性要求较高的车型投入生产。在这里,定位仍然很广泛,涵盖多种类型的模型和用途。
最后,超大规模企业仍然是结构性竞争对手。 AWS、Google Cloud 和 Microsoft Azure 为其云生态系统提供集成、强大且深度互连的推理服务。它们的优势在于基础设施的深度,但这种概括可能会成为媒体生成等特定用例的障碍,在这些用例中,经济权衡和延迟需要更高级的优化。
Runware 由 Flaviu R. 和 Ioana Hreninciuc 于 2023 年创建,刚刚在 A 轮融资中筹集了 5000 万美元,约合 4250 万欧元,由 Dawn Capital 领投,Speedinvest 和 Comcast Ventures 以及 Insight Partners、a16z speedrun、Zero Prime Ventures 和 Begin Capital 等现有投资者参与。