本话题由记者易蓉主持。在实验室里,机器人机械臂灵巧地工作,自动存储、传输和分析实验数据。它由一个科研机构管理。中国大学中此类实验室的数量正在增加。人工智能(AI for Science,AI4S)驱动的科学研究正在从提高特定领域的效率转向链接更广泛、更高层次的领域。通过不断建设和完善数据库、基础模型、智能体等新的AI4S科研“基础设施”,成为科学研究“伙伴”的AI是否会超越人类,承担起“发现”使命?科学研究能否实现“自动驾驶”体验?科学人工智能是科学发现背后逻辑的一场革命。中国工程院外籍院士、香港科技大学高级副校长郭亦科chnology表示:过去的一年,人工智能领域的重大发展让人们应接不暇,科学智能成为大家最关心的话题。科学研究最重要的是科学发现。作为一名科学家,我最关心的是人工智能是否能够做出发现。这种“发现”是人类的专属领域还是机器也可以参与其中?这就是我今天要讨论的中心建议。 AI能“找到”它吗?从贝叶斯大脑到主动推理 要回答这个问题,我们必须回到首要原则:什么是“发现”?是否有一个我们相信的世界能够真正理解我们“看到”的东西?人类的大脑仅重1.4公斤,紧紧地封闭在头骨内。我们对外部世界的所有感知都来自于通过我们的五种感官接收到的信号。这些信号有两个特征。一是它是离散的、二维的,另一个是声音很大。我们能够重建一个三维的、清晰的、连续的世界图像,不是通过像相机那样的记录,而是通过我们的大脑做出的推论。这种“推断世界”的理论在认知科学中被称为“预测编码”理论。大脑有一个生成模型,利用现有的先验知识不断预测世界,同时接收来自感官的信号。只有与预测不相符的“巧合”才会被大脑捕获,并作为修改我们认知的材料。那么什么是“发现”呢?发现是出乎意料的事情。贝叶斯定律告诉我们:当人们看到某些东西时,他们不会相信它。如果你相信,你就会看到。这与“情人眼里出西施”是同样的道理。当你看到一个人觉得她很漂亮时,那是因为你脑子里已经有了一个“美”的模型,并且有一个你会喜欢的先验知识e那个人。先验是你的主观感知,概率是你的观察。先验和观察结合起来形成新的感知。如果观测值偏离先验值,这种偏离就是“误差”,在物理学中被称为“自由能”。这种自由能对大脑有两个影响。一是修正认知,称为感性推理。另一种是改变世界,使其符合你的期望,这叫主动推理。主动推理是基于人工智能(AI4S)的科学研究最重要的理论基础。感知推理是我们熟悉的机器学习,而主动推理是指体现智能。一切都很好,不是在机器人中构建一个大型模型,而是允许“动作”。 “运动”本身就成为推理链条中的一个环节。行动不是结果,而是消除错误的手段。好奇心从何而来? e 在哪里探索行为从何而来?这一切都源于我们减少世界不确定性的努力。这就是探索的动力的来源。所以我的结论是:人类和机器智能在物理上是同源的,在数学上是同构的。由于人类认知本身就是一个完整的、可描述的机制,因此无需怀疑机器是否有能力进行发现。由此看来,从某种意义上说,机器不仅可以进行发现,而且其发现的方法和逻辑可能与人类根本相同。 AI在科学实验中:从被动记录到主动推理近年来,我们看到AI提高了药物筛选效率、加速蛋白质结构预测、优化材料合成路线……但这些不仅仅是“效率问题”,这意味着将原本需要三年的工作减少到三个月。这种效率的提升主要得益于智能化科学实验(AI for Lab)系统化地利用人工智能进行科学实验,将人工智能从“效率工具”转变为“伙伴”,将实验室管理系统从“被动记录”转变为“主动推理”。我目前正在运行此类研究的人工智能原生创新环境(AINA,AI Native)。传统的科学研究过程中,科学家提出假设、收集数据、分析结果和撰写报告,涉及许多重复的程序性任务,例如填写电子表格、撰写实验笔记、管理库存和归档数据。今天,我们使用大规模模型和智能代理来自动化这些任务。全天 24 小时提供服务。它在系统内自主运行,并根据现有的先前模型和实验结果计算误差,推动实验室设计并触发工作流程。例如,当教授决定研究方向时,代理会自动生成n实验计划,发现问题后自动修正数据,最终生成报告。该系统的核心是一组智能体的自主协作。机制:触发任务、智能体之间的协作、持续的自我进化。主动推理在这里充分发挥作用,包括发现错误、重新设计实验和重新修改工作流程。这不仅仅是自动化,而是真正的自我进化。与以前“利用人工智能解决特定问题”的模式不同,今天的 AINA 需要构建一个完整的生态系统,从数据收集和知识管理到实验设计、结果验证和报告。知识的生成和传播集成在人类、人工智能群体和智能体之间的协作闭环中。第一层是人类代理,负责提议和最终确定地址。第二层是智能体组,负责数据分析、推理、实验设计。第三层是Agent的自主协作机制,负责自行触发、执行和开发任务。马苏。这三个架构层构成了原生人工智能科学研究的新范式。愿景、现状和挑战:成为人工智能科学家的漫漫长路作为一名科学家,我理想的利用人工智能(AI for Discovery)的科学发现是什么?我希望未来的科学研究是“人类+人工智能”的深刻融合。科学家不再是孤独的探索者,而是与智能体群体合作的“司机”。一旦产生想法,人工智能可以立即完成文献综述、实验设计和代码生成。随着实验的进展,人工智能可以持续实时监控、自动调整和优化。随着结果的出现,人工智能可以生成报告,提出新问题,并促进下一步的探索。科学家从繁琐、重复的任务中解放出来并且可以专注于提出真正原创的假设和理解真正深刻的规律。我们离这个愿景还有多远?老实说,我们仍处于早期阶段。今天的代理已经是简化任务和明确权限的专家。例如,在科学实验室中,所有工作流程清晰,权限严格控制,是智能代理发挥作用的理想场景。然而,一旦我们离开这个明确定义的边界区域,代理的不确定性就会急剧增加。因此,我们不建议使用代理来管理个人文件系统。保密性和不确定性的风险太大。我们目前至少面临三个挑战。第一个是多模式对齐。我是如何构思我们如何捆绑这些不同形式的信息:蛋白质分子、化学分子、语言、文本?我们现在可以在视频中立即改变人们的衣服,但可以用文本准确地映射分子结构描述仍然需要在最低级别上取得进展。其次,数据的质量和标准化。 AlphaFold 之所以成功,是因为它基于数十年的高质量、标准化蛋白质结构数据。在其他领域,此类数据基础设施尚不存在,并且清理数据所需的能量受到模型的限制。它常常超越戒指本身。第三,信任和验证。人工智能可以产生幻觉,人类也可以产生幻觉,但在科学领域需要验证和抑制幻觉。每个阶段的质量控制和所有发现的验证都很重要。但我仍然有信心。 AI for Lab 是重要的一步,也是 AI for Discovery 的第一步。实验室的数据吞吐量巨大,人工智能正在逐渐消除知识验证和分析的瓶颈。这是一个巨大的产业,也是智能代理技术的一个很好的切入点。那些认为人工智能只能“猜测概念”的人ts”会失望。因为在科学实验室里,人工智能可以做一些实际的事情。我的最后一点是,人工智能对于科学来说不仅是一场技术革命,更是一场认知革命。它让我们重新思考“发现”的本质,重新思考“智能”的极限。人永远是这场探险的中心,但我们将不再独行。
(编辑:李东阳)
每日更新