在半个世纪的时间里,科学研究已经产生了数百万个研究。他们常常会积累而没有被重新读书,验证或复制。人工智能现在提供了一个前所未有的解决方案:重读,跨和审核整个科学语料库,以识别偏见,死胡同和错误的假设。
二十年来,可重复性危机一直困扰着科学。 2012年,安进(Amgen)透露,他能够重现她在肿瘤学中选择的53项主要研究中的6项。在心理学中,面对独立验证,超过60%的经历不会服用。在许多领域,出版物动态优先于验证要求。
问题是结构性的。经济激励措施,期刊的压力,针对“有结果”的主体的资金产生了有时可疑数据的大量积累。某些中心假设,例如阿尔茨海默氏症中的β-淀粉样蛋白的假设,在没有最终验证的情况下取代了数十亿欧元的研究。
全球审核成为可能
大型语言模型(LLM)改变了可能的规模。能够摄入数千篇科学文章,它们可以:
-
- 互相引用的跨纸;
- 检测低相关性或统计错误;
- 确定研究所忽略的领域;
- 评估没有认知偏见的语料库的鲁棒性。
结果:全球,详尽,中立的重读。在几个小时内,模型可以识别出孤立的研究人员需要数年才能发现的矛盾之处。审核变得自动,系统性。
走向由人工智能控制的搜索
除了分析外,一些实验室还开始将AI纳入科学创建过程本身。诸如板凳或翡翠云实验室之类的平台使人可以将AI产生的假设转换为在自动实验室中进行的具体体验。
序列变为机械:AI读取文献,识别缺陷或缺乏,提供协议,将其发送给机器人,恢复结果,分析并重新开始。研究变得连续,没有破裂,没有疲劳,没有直觉,但是严格。
错误的终结…还是发现?
那里的限制。研究的重要组成部分是由于事故的随机错误。青霉素,微波炉或伟哥是由于无法预料的偏差而诞生的。旨在减少偏差的AI可能会使这种创新来源枯竭。
一些团队已经探索机制,以人为地将“噪音”引入模型。目的:模拟偶然性,导致建设性事故。但是我们可以编程出乎意料吗?
短期混凝土效应
在许多部门中的影响将是相当大的:
-
- 在药房中,可以重新发现或重新定位废弃的分子。
- 在医学上,与文献交流的个人健康数据将确定有针对性的治疗方法。
- 在公共实验室中,科学生产力将被乘以受控工具的访问。
所有者数据库将变得战略性。在这种新饮食中,该模型的数据少于它可以探索的数据。医院,州,大学将成为知道如何重估的持有人。