科技·商业·财经

Jumper加入Anthropic后深度剖析:AlphaFold突破源于架构创新而非算力堆砌

   时间:2026-06-27 14:03 作者:格隆汇

在人工智能推动科学进步的浪潮中,AlphaFold无疑是一个里程碑式的存在。它攻克了困扰生物学界超过五十年的蛋白质折叠难题,将原本需要数年才能完成的蛋白质结构分析缩短至几分钟,其核心开发者John Jumper也因这一突破性贡献荣获诺贝尔化学奖。这一成就不仅改变了蛋白质研究的范式,更引发了人们对AI技术发展路径的深刻思考。

传统上,科学家们通过结晶蛋白质并利用同步加速器产生的X射线进行分析,这种方法耗时耗力,往往需要数年时间才能获得一个蛋白质的结构。AlphaFold的出现彻底改变了这一局面。它通过深度学习技术,将预测误差缩小到原子半径级别,精度可与传统实验方法媲美。更令人惊叹的是,AlphaFold团队已经预测了超过两亿个蛋白质的结构,几乎涵盖了地球上所有已知生物的蛋白质,并将这些数据免费向全球开放,为生物学研究开辟了新的可能性。

John Jumper在最近的一次访谈中详细阐述了AlphaFold的成功并非依赖于简单的算力堆砌,而是源于对蛋白质折叠问题的深刻理解和定制化的架构设计。他指出,AlphaFold 1采用了计算机视觉中的现成卷积神经网络(CNN),而AlphaFold 2则从头构建了一个专门针对蛋白质折叠任务的科学架构。这一架构的核心是EvoFormer,它利用了蛋白质在进化过程中缓慢变化的特性,通过分析成百上千条相关序列,在几何认知和演化认知之间建立了桥梁。EvoFormer占据了计算量的90%以上,也贡献了90%以上的准确率。

Jumper特别强调了AlphaFold 2中“框架对齐点误差”(FAPE)这一损失函数的重要性。他通过消融实验证明,尽管等变性和SE(3)不变性对模型性能有一定贡献,但它们并非AlphaFold 2成功的唯一原因。事实上,移除这些特性对模型性能的影响非常有限。Jumper认为,AlphaFold 2的成功在于它在架构和训练中融入了定制化的创新,这些创新带来了数据效率的巨大飞跃。例如,AlQuraishi实验室仅使用1%的PDB数据重新训练AlphaFold 2,其准确率就超过了AlphaFold 1。

AlphaFold 3的发布进一步扩展了AI在生物学领域的应用范围。与前代模型专注于单个蛋白质不同,AlphaFold 3能够预测蛋白质与其他分子(如脂质、药物小分子)的相互作用。Jumper解释说,AlphaFold 3的扩散过程与图像领域的扩散模型有本质区别。在AlphaFold 3中,扩散过程更像是一个“几何化引擎”,它在主干网络已经决定了分子整体结构的基础上,进一步求解微观细节。这种设计使得AlphaFold 3能够更准确地预测药物与蛋白质的结合位置,为药物研发提供了新的工具。

Jumper在访谈中也区分了预测、控制和理解三个概念。他认为,AI可以赋予我们预测和控制的能力,但真正的理解仍然需要人类的参与。AlphaFold生成的蛋白质结构数据可以作为实验对象,帮助科学家们构建对生物学机制的理解,但机器本身无法完成这一过程。他进一步指出,机器学习的本质是代码与数据相互作用形成权重的过程。AlphaFold的迷人之处在于,它学会的算法是一种人类能够理解、能够用简洁语言描述的算法:连续的几何精炼。

在讨论通用人工智能(AGI)时,Jumper表现出了谨慎的态度。他认为,显式设定表征的重要性已经不如过去人们想象的那么大。AlphaFold的例子表明,模型在追求精准预测的过程中,会自发地寻找优质的中间表征。许多曾被认为对智能必不可少的要素,如今发现只需在预测下一个token的过程中做到极致,就会自然涌现。然而,这种涌现的代价是巨大的算力和数据需求,如何以更低的成本获得这些概念和表征,仍是当前面临的核心挑战。

 
 
更多>同类内容
全站最新
热门内容