强化学习 vs LLM，INEFFABLE INTELLIGENCE 融资 9.37 亿欧元

我们不知道Ineffable Intelligence在欧洲技术领域的出现是否仍然是风险投资经典序列的一个例外，或者它是否宣布了一种新的投资标准的出现，其中某些最近的业务，如AMI Labs，可能构成第一个里程碑。

这家伦敦初创公司在种子轮融资中筹集了 9.37 亿欧元，估值达到 43 亿欧元，这家伦敦初创公司不仅进入了市场，而且还依靠经验积累的智能来挑战语言模型的霸权。

自从主要语言模型出现以来，业界逐渐与已经占据主导地位的范式保持一致。 OpenAI、Anthropic 或 Google DeepMind 开发的系统基于人类生产中大量积累的数据。它们的有效性在于能够在计算资源不断强化的支持下对大规模统计规律进行建模。这种方法允许用例快速传播，从软件副驾驶到对话代理，并有助于将法学硕士安装为标准基础设施。

这个框架虽然看起来很稳定，但也暴露出结构性限制。对现有数据的依赖引发了法律和经济以及认识论问题。这些系统尽管很复杂，但从根本上仍然依赖于训练它们的语料库。除了重组或推断之外，它们产生真正新知识的能力仍然不确定。当然正在研究替代方法。

David Silver 领导的项目就是其中之一。他是谷歌 DeepMind 强化学习的前负责人，他的工作标志着该学科的转折点。像 AlphaGo 或 AlphaZero 这样的系统已经证明，智能体可以通过交互学习来达到前所未有的性能水平，而不需要依赖注释数据库。通过用探索和优化的逻辑取代模仿，这项工作开辟了一条长期以来仅限于封闭环境的替代路径。

Ineffable Intelligence 的目标是设计一个能够从自身经验中获取技能并产生知识的系统。当语言模型通过观察人类痕迹来学习时，所采用的方法假设与真实或模拟的环境直接交互，代理在其中测试和完善其行为。

这两种范式之间的区别涉及人工智能的两种概念。一方面，系统从积累的数据中再现和重组现有结构。另一方面，代理人通过行动逐渐建立他们的理解。第二条道路尽管前景广阔，但仍面临重大限制。对足够丰富的环境进行建模、管理与探索相关的计算成本，甚至大规模学习过程的稳定性构成了所有未解决的挑战。

Ineffable Intelligence 本轮融资的构成反映了这一赌注的性质。红杉资本和 Lightspeed Venture Partners 包括 NVIDIA 和 Google 等领先技术公司以及英国公共机构。这种融合在现阶段的发展中是不寻常的，这表明该项目与其说是一个直接的商业机会，不如说是人工智能未来发展的一个战略选择。

英国商业银行和主权人工智能基金的参与引入了政治层面，也是通过专注于差异化方法而不是追赶现有模式，将英国定位于仍处于非结构化市场领域的愿望的一部分。在大型经济区之间竞争加剧的背景下，这一战略反映了一种解读，即学习架构的掌握成为主权问题。

从竞争角度来看，Ineffable Intelligence更多的是像DeepMind或OpenAI这样的先进研究实验室，将基础研究和产业部署结合起来，而不是严格意义上的创业生态系统。

对于投资者来说，操作也偏离了风险投资的通常逻辑。 43亿欧元的估值不是基于执行指标，而是基于科学论文的可信度以及团队证明其可行性的能力。在这方面，大卫·西尔弗的个人资料赋予了该项目特别的合法性。但这种赌注仍然存在不确定性，而且会持续很长一段时间，经济效益既不能立竿见影，也不能得到保证。

基本上，不可言喻的智能计划并不是质疑语言模型的相关性，而是质疑它们的确定性。随着它们的局限性变得明显，减少学习对人类数据的依赖的问题变得越来越重要。这种方法是否可以大规模实施还有待确定。在巩固既定范式和探索替代轨迹之间，今天的人工智能似乎正处于一个分叉阶段，其结果仍然悬而未决。