AI能否终结材料科学的“死水”时代?初创公司押注自主实验室,以AI为“总指挥”加速发现,但虚拟与现实的鸿沟仍存巨大争议!

AI驱动的自主实验室:材料科学的“ChatGPT时刻”何时到来?
在位于马萨诸塞州剑桥市的Lila Sciences实验室里,一台微波炉大小的仪器正在运行。它采用“溅射”技术,在真空室内汽化不同元素,形成薄膜样品。但关键区别在于:这次实验的“总指挥”是人工智能。 一个经过海量科学文献和数据训练的AI智能体,不仅制定了实验配方,还在实时调整元素的组合。
随后,样品——每个都包含多种潜在的催化剂——被送到实验室另一区域进行测试。另一个AI智能体将扫描并解读数据,据此建议下一轮实验,以优化材料性能。目前,人类科学家仍会密切监督,并根据AI的建议和测试结果批准后续步骤。但这家初创公司坚信,这台AI控制的机器是材料发现未来的缩影:自主实验室将使发现新颖有用化合物的成本更低、速度更快。
Lila Sciences是AI领域最新的独角兽之一,获得了数亿美元的新融资。其宏大使命是利用AI自主实验室进行科学发现,目标是实现所谓的“科学超智能”。而当前,我们迫切需要更好的材料来解决一系列问题:更强大的电池电极、更廉价高效的二氧化碳捕获化合物、制造绿色氢能和其他清洁燃料的催化剂,以及用于量子计算、核聚变和AI硬件的下一代高温超导体、改进的磁体和新型半导体。
然而,材料科学在过去几十年里商业成功寥寥。部分由于其复杂性和缺乏突破,该领域已成为创新的“死水”,被更光鲜、利润更丰厚的新药研发和生物学研究所掩盖。
AI的介入与现实的瓶颈
利用AI发现材料的想法并不新鲜,但它在2020年DeepMind的AlphaFold2模型能准确预测蛋白质三维结构后获得了巨大推动。2022年ChatGPT的成功和流行,更让科技界相信,类似的深度学习模型也能助力科学研究。为何不用新的生成式AI能力,在广阔的化学领域中搜索,帮助模拟原子结构,从而指向具有惊人特性的新物质?
但现实是,想象新结构远非最耗时、最昂贵的步骤,真正的瓶颈在于在现实世界中制造它们。 在尝试合成一种材料之前,你无法确定它是否能被制造、是否稳定,其许多特性也只有在实验室测试后才能知晓。
Lila Sciences的首席自主科学官John Gregoire指出:“模拟在界定问题和理解实验室中值得测试的内容方面非常强大。但仅靠模拟,我们无法解决现实世界中的任何问题。”
因此,像Lila Sciences这样的初创公司将战略押注于利用AI改造实验本身。它们正在建设使用智能体来规划、运行和解释实验结果以合成新材料的实验室。实验室自动化早已存在,但新想法是让AI智能体将自动化提升到新高度,指挥自主实验室,其任务包括设计实验、控制搬运样品的机器人,并利用AI吸收和分析海量实验数据,寻找更好材料的线索。
如果成功,这些公司可将发现过程从数十年缩短到几年甚至更短。但这是一场赌博。尽管AI已接管许多实验室杂务,但要独立发现新的、有用的材料,完全是另一回事。
虚拟与现实的鸿沟:DeepMind的“百万新材料”争议
或许没有什么比DeepMind在2023年底的声明更能体现虚拟与现实世界之间的鸿沟了。该公司宣布利用深度学习发现了“数百万种新材料”,包括38万种被宣布为“最稳定、有望进行实验合成”的晶体。在AI界,这似乎是众人期待已久的突破。
但一些材料科学家反应截然不同。加州大学圣巴巴拉分校的研究人员仔细审查后表示,他们发现“几乎没有证据表明这些化合物同时具备新颖性、可信性和实用性”。事实上,他们并未在其中发现任何真正新颖的化合物;有些只是已知化合物的“微不足道”的变体。科学家们特别不满的是,这些潜在化合物被贴上了“材料”的标签。他们写道:“我们谨建议,这项工作报告的不是任何新材料,而是一份拟议化合物清单。在我们看来,只有当一种化合物表现出某种功能并因此具有潜在效用时,才能被称为材料。”
一些设想的晶体根本不符合现实世界的条件。为了对如此多的可能结构进行计算,DeepMind的研究人员在绝对零度下进行了模拟,此时原子排列有序。但在实验室或世界上任何地方存在的更高温度下,原子会以复杂的方式运动,常常形成更无序的晶体结构。DeepMind预测的许多所谓新材料,似乎只是已知无序材料的“有序版本”。
更普遍地说,这篇论文再次提醒我们,至少在目前,在虚拟模拟中捕捉物理现实是多么具有挑战性。由于计算能力的限制,研究人员通常只对相对较少的原子进行计算。然而,许多理想的特性是由材料的微观结构决定的——其尺度远大于原子世界。而一些效应,如高温超导性,甚至许多常见工业过程关键的催化作用,过于复杂或未被充分理解,无法仅用原子模拟来解释。
融合之路:初创公司的雄心与挑战
尽管如此,有迹象表明模拟与实验工作之间的鸿沟正在开始缩小。DeepMind表示,自2023年论文发布以来,他们一直在与全球实验室的科学家合作合成AI识别的化合物,并取得了一些成功。同时,许多进入该领域的初创公司正寻求将计算和实验专长结合在一个组织内。
其中之一是Periodic Labs,其联合创始人包括领导了2023年DeepMind研究团队的物理学家Ekin Dogus Cubuk,以及ChatGPT的联合创造者之一Liam Fedus。尽管创始人有计算建模和AI软件背景,但该公司将其材料发现战略的很大一部分建立在自动化实验室的合成上。
该公司的愿景是通过使用在科学文献上训练并能从持续实验中学习的大型语言模型,将这些不同领域的专业知识联系起来。LLM可能会建议制造化合物的配方和条件;它还可以解释测试数据,并向公司的化学家和物理学家提供额外建议。在这一策略中,模拟可能会提出可能的候选材料,但它们也用于帮助解释实验结果并提出可能的结构调整。
终极目标将是室温超导体——一种可以改变计算和电力行业,但几十年来一直让科学家望而却步的材料。
像Lila Sciences一样,Periodic Labs的雄心超越了设计和制造新材料。它希望“创造一个AI科学家”——特别是一个精通物理科学的科学家。Cubuk表示:“LLM在提炼化学信息、物理信息方面已经相当出色,现在我们正试图通过教它如何做科学——例如进行模拟、实验、理论建模——来让它更先进。”
这种方法基于一种期望:更好地理解材料及其合成背后的科学,将有助于研究人员找到广泛的新材料线索。 室温超导体的发现是过去几十年材料科学最大的失望之一。尽管有早期的乐观情绪,但科学家们仍未在正常条件下找到在室温或接近室温下超导的材料。现有的最佳超导体很脆,难以制成优质导线。
寻找高温超导体如此困难的原因之一是,没有理论能解释相对高温下的效应,或仅从原子在结构中的位置来预测它。最终,实验室科学家需要合成任何有趣的候选材料,测试它们,并在产生的数据中寻找线索,以理解这一仍然令人困惑的现象。Cubuk表示,这是Periodic Labs的首要任务之一。
自动化与“自动驾驶实验室”的现状
研究人员首次制造一种晶体结构可能需要一年或更长时间。然后通常还需要数年进一步工作来测试其特性,并弄清楚如何制造商业化产品所需的大量材料。
像Lila Sciences和Periodic Labs这样的初创公司,主要寄希望于AI指导的实验能大幅缩短这些时间。乐观的一个原因是许多实验室已经引入了大量自动化,从制备样品到运送测试物品。研究人员常规使用机械臂、软件、自动化显微镜和其他分析仪器,以及操作实验室设备的机械化工具。
这种自动化实现了高通量合成,可以快速创建和批量筛选具有不同成分组合的多个样品,大大加快了实验速度。想法是,使用AI来规划和运行这种自动化合成,可以使其更加系统化和高效。AI智能体可以收集和分析比任何人类多得多的数据,并利用实时信息改变成分和合成条件,直到获得具有最佳性能的样品。这种AI指导的实验室可以比人类做更多的实验,并且比现有的高通量合成系统更智能。
但所谓的材料“自动驾驶实验室”仍在发展中。许多类型的材料需要固态合成,这是一套比制药中常见的液体处理活动更难自动化的过程。你需要以正确的组合制备和混合多种无机成分的粉末,然后决定如何处理样品以创建所需的结构——例如,确定进行合成的正确温度和压力。甚至确定你制造了什么都很棘手。
2023年,劳伦斯伯克利国家实验室的A-Lab声称是第一个完全自动化使用无机粉末作为起始原料的实验室。随后,科学家报告称,该自主实验室利用机器人和AI合成了41种新材料,包括DeepMind数据库中预测的一些材料。一些批评者质疑所产物的新颖性,并抱怨材料的自动化分析未达到实验标准,但伯克利的研究人员辩称,这只是展示了自主系统的潜力。
该实验室的首席科学家Gerbrand Ceder表示:“它今天的工作方式和我们设想的方式仍然有些不同。还有很多工具需要构建。”AI智能体已经擅长做许多实验室杂务,从准备配方到解释某些类型的测试数据。但Ceder希望这项技术能很快“捕捉人类决策”,分析正在进行的实验,对下一步做什么做出战略选择。例如,他的团队正在研究一种改进的合成智能体,能更好地结合他所说的科学家的“扩散”知识——那种从广泛培训和经验中获得的知识。
AI智能体的优势之一是它们吞噬大量科学文献的能力。 Ceder说:“在我工作的一个领域——固态电池,每天有50篇论文发表。而这只是我工作的一个领域。”任何人都无法跟上。“AI革命最终是关于收集我们拥有的所有科学数据,”他说。
去年夏天,Ceder成为一家名为Radical AI的AI材料发现初创公司的首席科学官,并从加州大学伯克利分校休假,帮助在纽约市建立其自动驾驶实验室。一份演示文稿展示了旨在帮助实现Ceder愿景的不同AI智能体和生成模型组合。仔细看,你会发现一个名为“协调器”的LLM——CEO Joseph Krause称之为“头号人物”。
商业化之路与行业期待
到目前为止,尽管围绕使用AI发现新材料的热议不断,该领域也获得了越来越多的动力和资金,但仍未出现令人信服的重大胜利。没有像2016年DeepMind的AlphaGo战胜围棋世界冠军那样的例子,也没有像AlphaFold在掌握生物医学中最困难、最耗时的任务之一——预测蛋白质3D结构——方面的成就。
材料发现领域仍在等待它的“时刻”。如果AI智能体能够显著加快实用材料的设计或合成速度,类似于但优于我们现有的材料,那么这个时刻可能会到来。或者,这个时刻可能是发现一种真正新颖的材料,例如室温超导体。
无论是否有这样的突破时刻,初创公司都面临着将其科学成果转化为有用材料的挑战。这项任务尤其困难,因为任何新材料都可能需要在由大型现有企业主导的行业中商业化,而这些企业并不特别倾向于冒险。
风险投资公司SOSV的科技投资者兼合伙人Susan Schofer对该领域持谨慎乐观态度。但Schofer在2000年代中期曾在一家最早使用自动化和高通量筛选进行材料发现的初创公司担任催化剂研究员数年(该公司未能存活),她在评估要投资的初创公司时,希望看到一些证据表明该技术能够转化为商业成功。
具体来说,她希望看到证据表明AI初创公司已经“发现了新的、不同的东西,并且知道如何在此基础上进行迭代”。她还希望看到一个能捕捉新材料价值的商业模式。她说:“我认为理想的情况是:我从行业获得了一个规格。我知道他们的问题是什么。我们已经定义了它。现在我们要去建造它。现在我们有了可以销售的新材料,我们已经将其扩大到足以证明其可行性。然后我们以某种方式合作制造它,但我们通过销售材料获得收入。”
Schofer表示,虽然她理解试图重新定义科学的愿景,但她会建议初创公司“向我们展示你将如何实现目标”。她补充说:“让我们看看第一步。”展示这些第一步对于吸引现有大型材料公司更全面地拥抱AI技术可能至关重要。该行业的公司研究人员以前曾多次失望——几十年来,功能日益强大的计算机将神奇地设计新材料的承诺;组合化学,一种在2000年代初席卷材料研发实验室但收效甚微的时尚;以及合成生物学将制造我们下一代化学品和材料的承诺。
最近,材料界又被围绕AI的新一轮炒作周期所笼罩。其中一些炒作是由2023年DeepMind宣布发现“数百万种新材料”所推动的,这一说法事后看来显然承诺过高。当一名MIT经济学学生在2024年底发布一篇论文,声称一家未具名的大型企业研发实验室利用AI高效发明了一系列新材料时,炒作进一步加剧。AI似乎已经在彻底改变这个行业。
几个月后,MIT经济系得出结论:“该论文应从公共讨论中撤回。”论文脚注中致谢的两位著名MIT经济学家补充说,他们“对数据的来源、可靠性或有效性以及研究的真实性没有信心”。
AI能否超越炒作和虚假希望,真正改变材料发现? 也许可以。有充分证据表明,它正在改变材料科学家的工作方式,至少为他们提供了有用的实验室工具。研究人员越来越多地使用LLM查询科学文献,并在实验数据中发现模式。
但是,将这些AI工具转化为实际材料发现仍处于早期阶段。特别是使用AI运行自主实验室才刚刚开始;制造和测试东西需要时间和大量资金。作者访问Lila Sciences的那个早晨,其实验室大部分是空的,现在正准备搬到几英里外一个更大的空间。Periodic Labs刚刚开始在旧金山建立实验室。它从AI预测指导的手动合成开始;其机器人高通量实验室将很快到来。Radical AI报告称其实验室几乎完全自主,但计划很快搬到一个更大的空间。
当作者与这些初创公司的科学创始人交谈时,他听到了对这个长期处于药物发现和基因组医学阴影下的领域重新燃起的兴奋。一方面,有钱了。“你看到将AI和材料结合起来的巨大热情,”Ceder说。“我从未见过这么多钱流入材料领域。”
然而,重振材料行业是一个超越科学进步的挑战。这意味着向公司推销一种全新的研发方式。但初创公司从AI行业其他地方借来了巨大的信心。也许,在多年谨慎行事之后,这正是材料行业所需要的。
—
延伸思考
1. 技术路径之争:当前AI材料发现主要分为“计算模拟先行”和“实验驱动迭代”两条路径。DeepMind的“百万新材料”争议凸显了纯模拟的局限性。未来,是“模拟指导实验”更有效,还是“实验数据驱动AI再创新”的模式更能产生突破性材料? 两者如何更好地融合?
2. 商业化的现实门槛:即使AI辅助实验室成功发现了性能优异的材料,从实验室的“克级”样品到工业化“吨级”生产之间,依然存在巨大的工程化、稳定性、成本控制鸿沟。AI技术能否穿透这“最后一公里”,不仅优化材料配方,还能优化生产工艺流程? 还是说,这最终仍需依赖传统材料工程领域的积累与突破?
阅读 Technology Review 的原文,点击链接。