AI for Science 2026 H1:AlphaFold 3、药物设计引擎与科学 Agent
flowchart LR
A["AI for Science"]
A --> B["分类:前沿探索"]
A --> C["关键词:AlphaFold"]
A --> D["关键词:Drug Discovery"]
A --> E["关键词:材料发现"]
A --> F["关键词:Agent for Science"]
一年前讨论”AI for Science”,主要素材是 AlphaFold 2 在蛋白结构上做的事情,加上一些”模型可以辅助文献检索”的故事。到 2026 H1,内容已经明显扩展:AlphaFold 3 让蛋白、DNA、RNA、小分子等相互作用进入统一预测框架;Isomorphic Labs 的药物设计引擎把结构预测进一步推向药物研发流程;材料发现、AI for Math、科学 Agent 也各自有了实质进展。本文不是综述,是 H1 事实切片。
延伸阅读:
先说结论
- 药物发现:AF3 已经把蛋白、核酸、小分子、离子、修饰等相互作用统一到全原子级预测框架;Isomorphic Labs 的药物设计引擎进一步把这些能力产品化
- Hit-to-Lead 周期 有望被显著压缩,但不能把单个合作管线或供应商表述直接当成全行业平均
- 材料发现:DeepMind GNoME / Microsoft MatterGen 已让”候选材料” 数量从年级几千上升到月级几百万
- AI for Math:Lean / Coq + frontier model 的组合已经能显著提高形式化证明辅助效率,但不能等同于通用数学研究自动化
- Agent for Science:Sakana AI、Google Co-Scientist 等项目把”读文献 + 提假设 + 设计实验 + 写报告” 的链路向前推进
- 未到的事:通用”端到端发现”(不依赖人类设定问题)、临床有效性(AI 设计的药物批量进入 Phase 3 还没发生)
1. AlphaFold 3:把”蛋白结构” 升级成”所有原子结构”
1.1 它做了什么
AlphaFold 2 (2021) 的能力是”给定氨基酸序列,预测蛋白三维结构”。AF3 的边界明显推宽:
- 输入可以是蛋白、DNA、RNA、小分子、离子、修饰基团等任意组合
- 输出是这些分子之间的全原子级三维交互预测
- 用 Diffusion Network(和 Stable Diffusion 同类的架构思想)替代 AF2 的 evoformer 主干
1.2 为什么对药物发现是关键
传统药物发现的瓶颈不在”找候选小分子”,在”预测它和靶点蛋白怎么结合”。这一步以前要靠:
- 物理模拟(AMBER、Gromacs)—— 慢、需要人类调参
- X-射线晶体学 / cryo-EM 实验 —— 准、但每个候选要花数月
AF3 在 protein-ligand、protein-DNA 等相互作用预测上比上一代方法明显更强,意味着团队可以先在计算机里筛掉大量低希望候选,再把更少、更有希望的分子送去做湿实验。
1.3 Cryptic Pocket:开了一扇新门
AF3 能识别”隐藏口袋”——蛋白表面在 holo-form(结合配体)时才暴露的结合位点。这件事的意义:之前被认为”无法成药”的靶点(很多癌症 / 神经退行),因为 AF3 能算出 cryptic pocket,开始有了候选化合物。
1.4 公开访问 + 学术可用,但不是“完整开源”
AF3 可以通过 AlphaFold Server 公开使用;模型代码和权重也面向学术/非商业用途开放申请和使用。但这不等于完整开源:官方条款对商业用途、参数再分发和共享都有明确限制。
这一区别很重要。对学术研究者,它已经足够进入日常工具箱;对药企和平台团队,它仍然需要认真核对许可、数据边界和商业合作方式。
2. Isomorphic Labs Drug Design Engine:不是官方“AlphaFold 4”
2.1 是什么
Isomorphic Labs(DeepMind 旗下药物发现独立公司)推出的 Drug Design Engine,不是 AF3 的简单升级,而是一套面向药物研发流程的商业系统:
- 把分子结构预测、候选筛选、性质评估和研发决策工作流放到同一套系统里
- 面向 hit identification / hit-to-lead 阶段,帮助团队更快缩小候选空间
- 与药企合作管线结合,更多是商业研发引擎,而不是公开通用模型
2.2 为什么不该直接叫”AlphaFold 4”
有些评论会把它类比成”AlphaFold 4”,主要是为了表达它在药物设计链路上的下一步意义。但这不是官方名称,直接写成”AlphaFold 4”会误导读者:
- AlphaFold 3 是公开论文和可申请使用的模型体系
- Drug Design Engine 是 Isomorphic Labs 的商业药物研发系统
- 两者有关联,但不是同一个发布物,也不是同一种开放程度
更准确的写法是:AI 药物发现正在从公开结构预测工具,进入商业化、管线化的研发引擎阶段。
2.3 它能不能做端到端药物设计
不能,至少目前不能。Drug Design Engine 这类系统主要解决 hit identification 和 hit-to-lead 阶段——找到结合得上、亲和力足够强的候选。后续的 ADMET 性质(吸收 / 代谢 / 毒性)、临床试验仍然需要传统流程。
但即便只解决前两步,行业影响也很大:如果 AI 能持续减少候选筛选和结构验证的试错次数,hit-to-lead 阶段就有机会从”按年迭代”向”按月迭代”靠近。这个判断应该作为趋势,而不是所有项目都能达成的承诺。
3. 材料发现:GNoME / MatterGen
3.1 GNoME (DeepMind, 2023-11,2024–2026 持续迭代)
GNoME 用 GNN 预测晶体材料的稳定性,给出了 220 万 个候选稳定材料(其中 38 万经过实验或计算验证)。这比人类历史所有发现晶体材料总和高一个数量级。
3.2 MatterGen (Microsoft, 2024-末–2026 内化)
MatterGen 是 diffusion model 直接生成材料晶体结构。和 GNoME 的”筛”不同,MatterGen 是”生”。两者结合代表了”生成 + 筛选”的两条线。
3.3 真实落地难在哪
模型生成的候选 ≠ 实际能合成的材料。从”理论上稳定”到”在实验室里跑出来”中间还有合成路径设计、工艺成本、规模化等大量人类工程问题。所以材料 AI 当前更像 hit-finding 而不是端到端发明。
4. Agent for Science:让 LLM 变成”实验科学家”
4.1 三个范式
| 产品 / 项目 | 关键能力 | 阶段 |
|---|---|---|
| Sakana AI Scientist | 自动跑文献综述 → 提假设 → 写代码 → 跑实验 → 写论文 | 已发表 ICLR 论文 |
| Google Co-Scientist | 假设生成 + critique loop + 实验设计 | 已公开研究并提供实验性工具 |
| Anthropic / OpenAI / Gemini 等研究型 Agent | 长任务阅读、综合、实验脚本生成 | 依赖具体产品与权限 |
4.2 现在做得好的事
- 文献综合 / RAG over papers:RAG 基础 风格但跨多篇论文和结构化资料
- 数值实验 / 代码生成:把 AlphaFold / 药物设计引擎接进来跑批量预测
- 报告 / draft 写作:把上面两步的结果产出成第一稿
4.3 仍然不行的事
- 真正的”假设生成”:Agent 提出来的假设质量普遍不如有经验的研究者
- 物理直觉 / 实验设计:不知道哪个实验有信息量、哪个是浪费
- 科学严谨性:模型容易把”看似有道理” 当成”有道理”
H1 末,“AI 写论文” 仍然是 80% 是辅助、20% 是自动——离 Sakana AI 期待的 “完全自主科学家” 还差得很远。
5. AI for Math / Theorem Proving
- Lean 4 + frontier model 已能显著辅助形式化证明、检索定理和补全证明步骤
- DeepMind AlphaProof (2024) 在 IMO 2024 拿到银牌成绩
- Goedel-Prover / DeepSeek-Prover-V2 等开源模型在 miniF2F 等基准上接近 frontier
但仍然没解决的是:真实数学研究里 90% 的工作是定义新概念 / 选取问题 / 找类比,证明只是最后一步。这不是 LLM 当前 fortes。
6. 当下能用 / 不能用
能用:
- 蛋白 / RNA / DNA 结构预测 → AF3 (公开 server)
- 药物 hit-finding → AF3 + 小分子库筛选
- 材料候选筛选 → GNoME 数据集
- 文献综合 → Sakana / Anthropic Research Agent
- 数学证明辅助 → Lean + frontier model / 专用 prover
不能用:
- 端到端药物上市(AI 药物设计引擎可以帮助 hit-to-lead,临床试验仍要多年)
- 自主科学家(H1 末仍是辅助形态)
- 自主材料合成(缺合成路径设计 + 工程实现)
7. 实践启示
| 你是 | 应该做什么 |
|---|---|
| 生物 / 药物研究者 | 把 AF3 / AlphaFold Server 纳入日常;关注 Isomorphic Labs 等商业药物设计引擎;不要等”全自动”,从”AF3 + 人 review” 做混合工作流 |
| 材料研究者 | GNoME 数据集已开源,可以下载筛你方向;MatterGen 仍未公开,关注但不要等 |
| 数学 / CS 研究者 | Lean + frontier model 已经能帮证明草稿和形式化补全;用 Agent 跑文献综合 + draft 需要人工审查 |
| 企业 / 投资人 | 关注 Isomorphic 的合作管线,看到 hit-to-lead 周期对比是 H1 最有信号的数字 |
| 政策 / 伦理 | 开始关注:AI 药物专利归属、AF3 数据访问公平性、Agent 自主性的边界 |
8. 关键词卡片
| 概念 | 一句话 |
|---|---|
| AlphaFold 3 (AF3) | DeepMind + Isomorphic 2024-05 推出,把蛋白 / DNA / RNA / 小分子等全原子交互统一在一个预测框架里 |
| Diffusion Network (in AF3) | 用 noise → denoise 范式生成 3D 坐标,不是 AF2 的 evoformer / structure module |
| Cryptic Pocket | 蛋白表面只有在结合配体时才暴露的结合位点;AF3 能预测这些 |
| Hit-to-Lead | 药物发现的中间阶段,从初步活性化合物(hit)到优化后的候选药(lead);AI 有望缩短迭代周期,但仍需湿实验和临床验证 |
| Drug Design Engine | Isomorphic Labs 的商业药物设计引擎,把结构预测与药物研发工作流结合 |
| GNoME | DeepMind 2023 推出的材料发现 GNN,给出 220 万候选材料 |
| MatterGen | Microsoft 的材料生成 diffusion model |
| Co-Scientist | Google DeepMind / Google Research 推出的”假设生成 + critique” 科学 Agent |
| AlphaProof | DeepMind 数学证明 Agent,IMO 2024 银牌 |
小结
如果你一年前问”AI for Science 是不是炒作”,合理回答是”过半”。今天问,合理回答是**“AlphaFold 这条线已经 ROI 正、其它线还在路上”**。
具体几个判断:
- AlphaFold 3 + 药物设计引擎是 2024–2026 内 AI 改造科学最实质的一条线——不是因为 demo 多,而是因为它开始嵌入真实研发流程
- 材料 / 数学 / 通用 Agent for Science 仍处在 demo 转 production 的过程——值得跟,但不是”明天就用上”
- 商业化趋势:最前沿的药物设计系统未必会完整开放,H1 末”前沿 AI 科学” 的商业化压力明显上升
- 下一阶段值得关注:DeepSeek / Z.ai 等中国玩家在 AI 药物发现领域是否会推出公开权重;新一代蛋白设计工具(RFDiffusion 后继)
参考链接
- AlphaFold 3 论文 (Nature)
- AlphaFold Server
- Isomorphic Labs Drug Design Engine 介绍
- AlphaFold 3 权重使用条款
- DeepMind GNoME
- Google DeepMind Co-Scientist
- Microsoft Research MatterGen
- Sakana AI Scientist
- DeepMind AlphaProof