谷歌深度学习模型AlphaFold 3重磅论文登上《自然》
每经记者 蔡鼎 每经编辑 兰素英
一直以来,谷歌从氨基酸序列出发预测蛋白质的深度上自三维结构是结构生物信息学中最具挑战性的问题。但几年前,学习镇江市某某软件科技客服中心由谷歌旗下公司DeepMind创建的模型基于深度学习的人工智能测序式模型AlphaFold解决了这个问题。
北京时间5月8日(周三)晚间,磅论《自然》杂志刊登了DeepMind的文登AlphaFold团队和伦敦药物研发公司Isomorphic Labs共同署名的论文,介绍了AlphaFold 3,谷歌这是深度上自AlphaFold的第三代版本,全新的学习蛋白质结构预测系统能以前所未有的精度预测“蛋白质数据库(Protein Data Bank)”内几乎所有分子类型的复合物结构。
论文称,模型AlphaFold 3是磅论一款革命性的系统。对于蛋白质与其他分子类型的文登相互作用,AlphaFold 3在基准测试中的谷歌准确率比现有最好的传统方法高出50%,且无需输入任何结构信息,深度上自这使得AlphaFold 3成为首个在生物分子结构预测方面超越基于物理工具的学习方法的人工智能系统。
实际上,镇江市某某软件科技客服中心自初代AlphaFold问世以来,结构生物学家们对其能力边界的讨论就从未停止。此前有研究证实AlphaFold还无法预测新的突变对蛋白质的影响。不过,这仍无法掩盖AlphaFold在预测生物结构方面前所未有的强大能力。美国洛斯·阿拉莫斯国家实验室研究员、新墨西哥州联盟高级科学家Thomas C。 Terwilliger在去年11月发表于《自然》杂志上的论文中称,尽管AlphaFold的预测并非全部准确,但其提供了可信的假说,可以用作提示机制。所有这些能力很可能只是人工智能方法在结构生物学中日益广泛应用的开端。
AlphaFold 3准确率比现有最好方法高50%
论文称,基于AlphaFold 2能力的提升,AlphaFold 3如今能预测蛋白质与蛋白质、核酸、小分子、离子、修饰蛋白质残基的复合物以及抗体-抗原相互作用,其预测准确性显著超过当前预测工具,包括AlphaFold-Multimer。DeepMind团队称,这意味着AlphaFold 3将人类带到了蛋白质之外的更广泛的生物分子领域。这一飞跃可能开启更多变革性的科学,从开发生物可再生材料和更具弹性的材料,到加速药物设计和基因组学研究等。
AlphaFold 2于2020年问世,可根据蛋白质的氨基酸(蛋白质的基本成分)序列预测其3D结构。论文第一作者、DeepMind高级研究科学家John Jumper和同事称,到目前为止,全球数以百万计的研究人员已经使用AlphaFold 2在疟疾疫苗、癌症治疗和酶设计等领域取得了进展。同时,AlphaFold 2据称已被用于预测数以亿计的结构,而按照目前全球的结构生物学实验的速度,这需要花费数亿年的研究时间。
据悉,AlphaFold 3的核心是深度学习模块Evoformer的改进版,Evoformer是AlphaFold 2的基础架构。论文称,只要给定分子输入列表,AlphaFold 3就会使用一个类似于人工智能图像生成器的融合网络来组合预测结果,不仅能生成它们的联合三维结构,还能揭示分子是如何结合在一起的。
论文称,AlphaFold 3在预测类似药物的相互作用(包括蛋白质与配体的结合以及抗体与目标蛋白质的结合)方面达到了前所未有的准确性。在基准测试中,AlphaFold 3的准确率比现有最好的传统方法高出50%,且无需输入任何结构信息,这使得AlphaFold 3成为首个在生物分子结构预测方面超越基于物理工具的方法的人工智能系统。
DeepMind团队认为,AlphaFold 3有能力将生物界带到前所未有的高度。该系统能够使科学家看到细胞系统的所有复杂性,包括结构、相互作用和修饰,同时揭示了它们是如何相互联系的,并有助于理解这些联系是如何影响生物功能的——比如药物的作用、激素的产生和DNA修复的健康保护过程。
AlphaFold 3的表现表明,开发正确的深度学习框架可以大量减少在这些任务中获得生物学相关性能所需的数据量,并扩大已经收集的数据的影响。DeepMind预计结构建模将继续改进,这不仅是因为深度学习的进步,而且还因为实验结构确定方法的持续进步,例如低温电子显微镜和断层扫描的巨大改进,将提供丰富的新训练数据,以进一步提高此类模型的泛化能力。实验和计算方法的并行发展有望推动人们更快速地进入一个对分子结构和疾病治疗更加了解的时代。
论文同时介绍,DeepMind新推出的AlphaFold服务器是全球预测蛋白质如何与细胞内其他分子相互作用的最准确的工具。
AlphaFold服务器是一个免费的平台,生物学家可以利用AlphaFold 3的强大功能来模拟由蛋白质、DNA、RNA以及一系列配体、离子和化学修饰物组成的结构。“AlphaFold服务器的影响将通过它们如何使科学家加速发现生物学和新研究领域的开放性问题来实现。我们刚刚开始挖掘AlphaFold 3的潜力,迫不及待地想看看未来会发生什么。”DeepMind团队在论文中写道。
而且,AlphaFold服务器可以帮助科学家提出新的假设,并在实验室中进行测试,从而加快工作进度,实现进一步的创新。如果采用传统方法,要实现蛋白质结构预测,不仅需要博士级别的知识水平,还要花费数十万美元才能完成。谷歌云平台plaorm还为研究人员提供了生成预测的便捷方法,即使研究人员没有计算资源或不掌握机器学习方面的专业知识也能操作。据悉,Isomorphic Labs正将AlphaFold 3与一套互补的内部人工智能模型相结合,为内部项目以及制药合作伙伴进行药物设计,以期加快并提高药物设计的成功率。
AlphaFold并非完全准确,但可作为提示机制
AlphaFold在不断迭代中展现出了强大的性能,而科学界对这一预测系统的边界探讨也一直存在。
美国洛斯·阿拉莫斯国家实验室研究员、新墨西哥州联盟高级科学家Thomas C。 Terwilliger在去年11月发表于《自然》杂志上的论文中称,AlphaFold的预测是有价值的假设,虽然可以加速药物的发现,但并不能取代实验结构确定工作。Terwilliger团队的研究显示,虽然AlphaFold的预测通常惊人的准确,但他们发现AlphaFold预测的许多部分与相应晶体结构的实验数据不兼容。
另外,一些研究人员也曾尝试将AlphaFold应用于会破坏蛋白质天然结构的各类突变,包括与早期乳腺癌有关的一个突变,但结果发现,AlphaFold还无法预测新的突变对蛋白质的影响,因为没有演化上相关的序列可以用来研究。
不过需要指出的是,Terwilliger团队在上述论文中仍对AlphaFold的能力给出了非常正面的评价。该团队写道——尽管存在局限性,但AlphaFold预测已经在改变蛋白质结构假设的产生和检验方式。尽管AlphaFold预测并非完全准确,但它们提供了可信的假说,可以作为提示机制,并允许设计具有特定预期结果的实验。
“所有这些能力很可能只是人工智能方法在结构生物学中日益广泛应用的开端。人工智能方法必将从蛋白质扩展到核酸、配体、共价修饰、环境条件,以及所有这些实体之间的相互作用以及多种结构状态。随着更多因素的加入以及序列和结构信息数据库的扩大,这些预测的准确性以及与之相关的不确定性很可能会不断提高。预测结果将成为越来越有用的结构假说,为生物系统的实验和理论分析奠定坚实的基础。”Terwilliger团队补充道。
(责任编辑:娱乐)
-
“欢迎凯旋!”“你们为国争了光!”“北京以你们为荣!”9月17日晚6时许,第47届世界技能大赛北京冠军团队从法国里昂载誉归来,乘坐班机平稳抵达北京大兴国际机场,受到了热烈欢迎。 在本次大赛中,北 ...[详细]
-
2024“家庭收入等级表”出炉:达到6级生二胎无压力,你家在哪级
一提到生二胎,多数家长的态度都是抗拒的,不是不喜欢孩子,而是压力实在是太大了,除了养育的支出外,教育成本也是家长不得不面临的难题。老一辈的家长一般很少和学生提到自己的具体收入,现在的年轻家长也是如此, ...[详细] -
每经记者 张宝莲 每经编辑 梁枭 5月10日晚间,东方材料SH603110,股价15.94元,市值32.08亿元)公告,控股股东、实际控制人许广彬持有公司股份6016.68万股已经被轮候冻结,占 ...[详细]
-
创作的内容被“搬运” 旅游博主停更三年2024-05-22 10:42:24 来源:扬子晚报 作者:于晓 ...[详细]
-
当地时间9月17日,苏丹卫生部发表声明表示,该国自今年7月暴发的新一轮霍乱疫情已致感染病例达10022例,其中328例死亡。 声明说,疫情仍在持续扩散,16日新增271例感染病例,其中3例死亡。 ...[详细]
-
在腾讯视频的《庆余年2》播了个如火如荼、横扫全网之际,爱奇艺派出了《狐妖小红娘·月红篇》出战,以女频大IP对打男频大IP,想来是存了不愿对家独美的心思的。该剧播出首日,在爱奇艺站内热度值为7225,系 ...[详细]
-
阳光斑驳地铺洒在公园的小径上,孩子们的欢声笑语在空气中跳跃。一个小男孩,满脸洋溢着无忧无虑的笑容,正迈着欢快的步伐奔跑着。然而,快乐总是短暂的,他突然一个踉跄,被一块不显眼的小石头绊倒在地。尘土飞扬间 ...[详细]
-
四年过去了,张近东的面容似乎没有什么变化。5月6日,张近东会见了美国某家电巨头,照片在几天之后被公布在了苏宁的官网上。在“隐身”了将近三年后,张近东似乎在用一张一张静态的图片,来宣告自己动态的回归。与 ...[详细]
-
来源:懂球帝 新赛季欧冠联赛阶段首轮,维拉客场3-0击败伯尔尼年轻人,阿马杜-奥纳纳斩获俱乐部生涯欧战首球。维拉生涯5场3球。 此役客战伯尔尼年轻人,首发出战的阿马杜-奥纳纳迎来俱乐部欧战生涯 ...[详细]
-
2024“家庭收入等级表”出炉:达到6级生二胎无压力,你家在哪级
一提到生二胎,多数家长的态度都是抗拒的,不是不喜欢孩子,而是压力实在是太大了,除了养育的支出外,教育成本也是家长不得不面临的难题。老一辈的家长一般很少和学生提到自己的具体收入,现在的年轻家长也是如此, ...[详细]