那个用AlphaGo打败人类的DeepMind,又攻克了生物学的世纪难题

创事记
微博
作者:
我有话说
来源:硅星人
文|An 编辑|Vicky Xiao
继AlphaGo赢了人类棋手,DeepMind 又 将触角涉及到生物科技领域。 DeepMind开发了一款人工智能软件AlphaFold, 使用了AI与算法相结合的方式来预测蛋白质中氨基酸对之间的距离,以 解决生物学最严峻的挑战之一——蛋白质折叠预测。
可以说,依靠 AlphaFo ld , 过去50年来未能解开的谜得以解开,为更好的治疗疾病和发现药物创造了更优的条件。
AlphaFold ”大杀四方“
CASP(Critical Assessment of protein Structure Prediction)是国际性的蛋白质结构预测的重要评估组织, 每两年进行一次蛋白质结构预测的全球试验比赛,主要目标是帮助推进从氨基酸序列中识别蛋白质三维结构的方法,被许多人认为是该科学领域的“黄金标准”。
2018年,AlphaFold首次参与CASP 13的竞赛,就取得了良好的表现。最初版本的AlphaFold在众多的参与者中获得了最高的准确率。
时隔两年,AlphaFold 2 新开发的深度学习架构推动了CASP14方法的变化,他们改变策略,开发新的AI网络,使得AlphaFold 2 可以预测目标蛋白质序列的最终结构。
本周 CASP表示DeepMind的AlphaFold系统在蛋白质结构预测方面取得了空前的准确性, GDT(Global Distance Test)准确性高于90%。
CASP 的John Moult教授在新闻发布会上说,"一个长达50年的重大挑战已经在很大程度上解决了。 "
德国进化生物学家Andrei Lupas说,AlphaFold已经帮助他找到了困扰他实验室十年的蛋白质结构问题,他希望这将改变他的工作方式和问题处理方式。 Lupas还说到,“这将改变医学。 改变研究。 改变生物工程。 改变一切。 ”
在DeepMind 8月的官方博客中也提到了AlphaFold系统可能对未来的疫情提供帮助。 他们在几乎没有氨基酸序列的前提下,准确的预测了冠状病毒中的两个蛋白质结构。
蛋白质折叠难题
许多对于生命至关重要的化学反应,都取决于蛋白质折叠为正确的三维形状。 如果蛋白质无法正确折叠,化学反应就无法完成,它就会变成“聚集物”。 在过去的研究中,研究人员一直将这种聚集过程与阿尔茨海默氏症、肌萎缩性侧索硬化症、亨廷顿氏病等疾病的形成联系到一起。 有证据表明,糖尿病和癌症也与蛋白质折叠失常有关联。
氨基酸序列准确预测蛋白质结构的能力将对生命科学和医学带来巨大的好处。 这将极大地加快了解细胞组成部分的工作,并使更快,更先进的药物发现成为可能。
人们的DNA编译蛋白质的分子式,蛋白质由氨基酸链组成。 但是DNA只包含氨基酸序列的信息,并没有折叠成形状的信息。 在蛋白质折叠成复杂的3D结构之前,随机举例一种典型蛋白质,它所有可能配置预测所需要的时间是无法估量的,然而蛋白质本身会在几毫秒内自发折叠。 预测这些链将如何折叠成蛋白质复杂的3D结构就是“蛋白质折叠问题”。
成千上万种不同的蛋白质存在每个活细胞内部,用来保持活力和健康。 预测蛋白质折叠的形状很重要,因为它决定了蛋白质的功能,几乎所有的疾病,包括癌症和痴呆症,都与蛋白质的功能有关。 科学家们认为蛋白质的形式决定了功能。 科学家可以通过了解到的蛋白质形状,有针对的开发相关药物。
科研人员在过去的五十年里,利用冷冻电子显微镜,核磁共振和X射线晶体学等方式反复试验去确定蛋白质的形状,但是耗费了大量的时间和财力也没有得出蛋白质的具体形状。 科学家估计,由于氨基酸之间相互作用的状况无法估计,在出现正确的结构之前,找出典型蛋白质的所有可能构型将花费超过138亿年的时间。
AlphaFold的出现使得生物学家可以通过AI的方法来取代之前繁琐和艰难的试验过程。 利用AlphaFold,使用遗传密码来预测蛋白质的形状。
AlphaFold在CASP 14的评估结果中,GDT总体平均得分在92.4。 GDT是CASP用来衡量试验标准性的指标,范围是0-100。 AlphaFold 的得分可以说是在蛋白 质结构的预测上达到了极高的准确性。
AlphaFold 的进化
早在2018年,AlphaFold就参与了CASP13 的竞赛,DeepMind使用了生成神经网络,提出了候选片段,然后插入到其他更为传统的结构优化工作流程中。 DeepMind将新旧技术与流水线相结合,该流水线将深度学习用于评分,将梯度下降用于目标优化。 利用深度学习的AI方法应用于结构和遗传数据,以预测蛋白质中氨基酸对之间的距离。
DeepMind的AlphaFold成功预测了43种蛋白质中25种的最准确结构,从而获得第13届CASP的冠军。 该项目的GDT评分的中位值为68.5分,虽然没有达到项目认可的90分以上,但这个数值也远超第二名。