| EN

自主研发蛋白质结构预测工具 性能超越 AlphaFold2

2022年12月20日

合作单位:华为技术有限公司、北京大学、深圳湾实验室

 

  • 建设并发布了已知规模最大的蛋白质多序列比对(MSA)开源数据集。

 

构建了世界范围内规模最大、参考数据集最新、覆盖度最广的开源蛋白质多序列比对数据集,该数据集采用学术界的“金标准”搜索方法,对约0.5亿条蛋白序列进行了充分的MSA搜索与比对,对解决蛋白质研究中所面临的高变异序列和孤儿序列等问题具有巨大的潜在价值。

 

  • 开发了自主可控的蛋白结构预测工具,多项指标已超越Alphafold 2。

 

推出了基于AlphaFold 2算法的蛋白质结构预测推理工具,并实现了训练的全流程打通,效率同比提升2-3倍。与AlphaFold 2相比,在混合精度下单步迭代时间由20秒缩短到12秒,性能提升超过60%。

 

  • 在全球蛋白质结构预测竞赛CAMEO中连续多周占据榜首。

 

通过算法、规模和软硬件支持上持续改进,在全球持续蛋白质结构预测竞赛CAMEO中连续多周占据榜首,填补了国产人工智能基础软硬件在蛋白质结构预测领域成绩的空白


keyanchengguoP4_画板 1.png