您知道 BIOPTIMUS 这家想要用人工智能进行生物学编程的法国初创公司吗?

研究人员承认,生物学仍然是人类试图理解的最复杂的系统。尽管积累了数十年的数据并建立了知识库,医学仍然没有强大的预测框架来合理地预测治疗效果或疾病的演变。这张生命的“不完整地图”可以转化为一个简单的数字:经过多年的开发和数亿美元的投资,几乎 90% 进入临床试验的药物都失败了。

人工智能以渐进的方式改变了生物学。 AlphaFold 由 Google DeepMind 开发,荣获 2024 年诺贝尔化学奖,它通过根据氨基酸序列预测蛋白质的三维结构,解决了几十年来一直悬而未决的问题,改变了游戏规则。但如果 AlphaFold 彻底改变了结构生物学,它也只涵盖了整个问题的一小部分。了解生命涉及将基因、蛋白质、细胞、组织、器官、环境和每个患者的病史联系起来。

这正是巴黎初创公司 Biooptimus 的雄心,该公司将自己定位在科学和工业领域,希望为生物学建立一个多尺度、多模态的基础模型,即生成生物模拟的“生命 GPT”。

从诊断人工智能到所有生物学的基础模型

一年内,该公司已将 H-Optimus-0 推向市场,这是一种开源病理学基础模型,是该学科最大的人工智能模型。来自哈佛大学和利兹大学的团队独立证明,它在多项任务上优于现有模型:从组织形态预测基因表达、卵巢癌亚型、生物标志物检测,从而可以更好地估计对某些治疗的反应。

H-Optimus-0 的下载量已超过 100,000 次,对于组织病理学这样的专业领域来说,这已经非常令人满意了。对于 Biooptimus 来说,该模型只是第一步,该路线图规定发布第一个能够连接遗传数据和成像的多模态模型,并直接应用于肿瘤学,特别是用于检测导致癌症的突变和改善患者分层。

从长远来看,我们的目标是构建数字双胞胎,即患者的数字双胞胎,整合他们的基因组、细胞和组织数据、临床病史以及最终的环境和生活方式因素。这些数字双胞胎甚至在给药前就可以用来模拟治疗效果,希望能大幅减少临床失败并个性化治疗策略。

三大关键资源:数据、计算和团队

为了声称能够对所有规模的生物学进行建模,Biooptimus 必须获得三项战略资产。

首先是数据,因为与互联网上的文本不同,足以训练基础模型的相关、高质量生物数据的数量是有限的,而且通常是专有的,并且很少公开。一些数据集的购买价格很高,有时为几千名患者花费数百万美元,而市场仍不稳定,今天支付的基础可能是一年后的开放标准或大幅贬值。该初创公司结合了公共数据、医院合作伙伴关系以及对孵化该公司的 Owkin 患者数据的访问,为其模型提供基于具体临床案例的支持。

另一个必要的资产是计算能力。在不到一年的时间里,Biooptimus 筹集了相当于 6500 万欧元的资金,其中很大一部分投资于 GPU 集群和专用云基础设施。筹集的资金的很大一部分被这些大规模模型的训练所吸收,这些模型能够集成多种模式并在异构数据量上运行。

最后是团队。 Bioptimus 汇集了来自 Google DeepMind、Owkin 和领先学术实验室的资料。在该领域,这意味着机器学习专家、病理学家、生物学家、高性能计算工程师和数据科学家共存的团队,每个人都在生物学或人工智能的特定领域具有极高的深度。

数据、道德和多样性:政治性多于技术性的复杂性

除了数据量之外,Biooptimus 还必须应对严格的定性和道德约束。并非所有数据都是相同的,病理模型可能会过度解释与某种扫描仪、载玻片制备方案或某些病理学家的报告书写习惯相关的伪影。因此,所寻求的多样性不仅包括人口统计(性别、出身、年龄),还包括技术(扫描仪类型)、组织(医院和诊所类型)和地理。

管理这些潜在偏差是核心,首先是出于科学表现的原因,然后是出于监管原因以及当局和临床医生对模型的可接受性。也正是在这种背景下,成立了一个由生物学、医学和机器学习领域的顶尖研究人员组成的科学顾问委员会,负责指导科学选择,为制药和数据提供商方面打开大门,并对正在建设的模型架构提出挑战,其中包括 SAB 主席 Sarah Teichmann 博士(剑桥大学)、Andrea Califano 博士(哥伦比亚大学,纽约 CZ Biohub)和 Caroline Uhler 博士(麻省理工学院、博德研究所)。

资本、竞争和产品轨迹

从竞争角度来看,Biooptimus 所处的环境中,多家参与者都追求相似的目标,有时甚至拥有更多的财务资源,例如中国的 Isomorphic Labs (Alphabet) 或 XtalPi。

2025年1月,该初创公司完成了融资 4100万欧元 获得由 Cathay Innovation 领投的 A 轮融资,Bpifrance(通过其大型风险基金)、Sofinnova Partners、Andera Partners、Hitachi Ventures、Sunrise、Boom Capital Ventures 和 Pomifer Capital 参与,累计融资额约为 7600 万美元。 Biooptimus 声称在资本配置方面有严格的定位:选择目标病症、在早期商业化和追求长期路线图之间进行仲裁、选择真正与众不同的数据集,而不是“引人注目”但很快就变得无足轻重的数据集。这笔资金应该能够加速第一个商业多模式模型的开发,扩大稀有数据的获取范围,并在五到十年内实现建立能够模拟每个患者从微观到宏观生物学的数字双胞胎的目标。

Biooptimus 背后是一群精英科学家、工程师和企业家,由联合创始人兼首席执行官、Owkin 前研究总监和 Google Brain 前研究经理 Jean-Philippe Vert 领导。他拥有极高的学术水平(巴黎综合理工学院数学博士,发表论文超过 190 篇),在生命科学领域的人工智能方面拥有丰富的经验。

与他一起的还有来自 Google DeepMind 和 Owkin 的几位联合创始人,包括 Rodolphe Jenatton(首席技术官)、Zelda Mariet(研究副总裁)、Felipe Llinares-López(AI 副总裁),以及 David Cahané 和 Eric Durand,他们在机器学习、人工智能应用于生物学、生物信息学和生物医学数据建模方面带来了尖端科学技能。 2024 年 11 月被任命为首席运营官的 Mathilda Ström 的运营和战略领导对这一创始基础起到了补充作用。