登录

科学网—平地惊雷:AlphaFold 2解决了蛋白质结构预测的问题?


速读:平地惊雷:AlphaFold2解决了蛋白质结构预测的问题?
平地惊雷:AlphaFold2解决了蛋白质结构预测的问题?

精选

已有 205 次阅读

2020-12-2 21:44

| 个人分类: 科技推广 | 系统分类: 科研笔记

平地一声惊雷,Google的 AlphaFold2在今年第14届蛋白质结构预测的比赛(CASP14)中对大部分的蛋白实现了原子精度或者接近原子精度的结构预测,把学术界的预测远远甩在后面,整个计算生物和结构生物学界这回真的被震惊了。两年前(CASP13),AlphaFold还只是比学术界好那么一点。而这次比赛,学术界赶上了AlphaFold的水平,但AlphaFold2却实现了一个量子的飞跃! 刚刚结束的 CASP14会议,关于AlphaFold2的具体方法,虽然有一些提示,但还是语焉不详,估计要等下一篇Nature文章发表了之后才能彻底搞清楚。但即使如此,许多在这个领域工作的科研人员(包括我们)都蠢蠢欲动,希望能从这个会议演讲的提示里找到AlphaFold2致胜的杀手锏,估计到第15届,顶尖的课题组就都能赶上AlphaFold2了,避免一家独尊。 但是, AlphaFold2真的解决了蛋白质结构预测的问题了吗?这次CASP14的多数蛋白质有较多的同源序列,所以学术界都能够比较准确地预测蛋白质的大体形状(topology)。AlphaFold2比其他组更加成功的原因在于能够对同源序列里面的相关突变信息,不仅仅在主链,而且对支链的结构上进行更加深度、可靠地挖掘。为了尽可能找到最多的同源序列,AlphaFold2用了3个序列数据库(UniREF, BFD, 和MGnify),并且为了学到最多的结构信息,AlphaFold2把所有的17万已知结构都放进数据库里面了。有了这些大数据,才实现了原子精度的结构预测。也就是说,假如某个蛋白在其他生物体没有同源序列的话,AlphaFold2也就无能为力了。事实上我们课题组的工作发现,用同源序列的话,蛋白质的二级结构预测可以达到86%左右,接近理论的极限,但没有同源序列,只有单序列信息的情况下,二级结构预测只能达到73%,所以单序列结构预测(真正的蛋白质折叠问题)还任重道远着呢!还请基金会继续支持!

转载本文请联系原作者获取授权,同时请注明本文来自周耀旗科学网博客。 链接地址: http://blog.sciencenet.cn/blog-472757-1260848.html

上一篇: 马拉松考试是怎样度过的:记小女儿的IB高中毕业统考

主题:AlphaFold2|蛋白质|问题|蛋白质结构预测|平地惊雷