在过去几十年中,蛋白质折叠问题一直是结构生物学和生物物理学的核心难题。随着深度学习方法,尤其是AlphaFold2的突破,蛋白质结构预测迎来了革命性的飞跃。然而,这些方法主要针对的是“正确折叠”的单体蛋白,对于那些在疾病发生中发挥关键作用、具有高度结构多样性的淀粉样蛋白(amyloid fibrils)却仍力不从心。昌平实验室陈明辰团队在PNAS上发表了题为“Generating the Polymorph Landscapes of Amyloid Fibrils Using Artificial Intelligence: RibbonFold”的研究论文。该研究提出了全新的RibbonFold方法,通过引入“丝带构象假说”并在深度学习模型中施加结构约束,首次系统性预测并重现了多种淀粉样蛋白的构象多态性,为理解神经退行性疾病等相关病症的分子机制提供了新的窗口。
进化的“漏斗”之外:淀粉样蛋白的错误折叠之路
众所周知,进化倾向于将天然蛋白的能量景观雕塑为“漏斗”状,确保它们能迅速而准确地折叠至功能性结构。然而,并非所有蛋白都遵循这一法则。越来越多的研究揭示,一类被称为“本征无序(intrinsically disordered protein)”或“模糊(Fuzzy)”的蛋白质,具有高度多样的构象,甚至在无明确结构的情况下完成生物功能。而更极端的是,一些蛋白在特定条件下——比如高浓度、pH变化、突变或金属离子存在时——会自发形成淀粉样纤维。淀粉样纤维的结构特征不仅限于其有序性,更令人惊讶的是其“多态性”(polymorphism):同一条蛋白质序列可以在不同条件下组装成多种三维构型,这种多样性不仅与疾病的发生密切相关,甚至可能决定不同病人的疾病类型和进展速度。例如,Aβ蛋白在阿尔茨海默病中的不同聚集体形式与病理分型相关,α-Synuclein的不同构象则对应于帕金森病与多系统萎缩等不同神经系统疾病。
RibbonFold方法:结构生物学与AI的深度融合
面对这些挑战,团队开发了RibbonFold方法,它不仅继承了AlphaFold2在序列到结构预测方面的强大能力,更通过“结构约束注入”策略专为预测淀粉样蛋白结构而设计。
RibbonFold的核心创新在于引入“丝带限制”(Ribbon constraints)——假设在几乎所有淀粉样纤维中,单体蛋白是以平行对齐的β-片层形式重复堆叠。这一假设来源于实验观察,是淀粉样纤维的普遍结构特征。RibbonFold通过将这一结构特征以模板形式硬编码进AlphaFold2的网络框架,从而将搜索空间从全三维折叠简化为二维“丝带折叠”,极大地提高了预测效率和准确性。RibbonFold还引入了训练多样性损失函数,使得模型能学习到尽可能多样的构象而非单一结构,从而探索构象多态性景观。
图1.RibbonFold模型框架&训练策略
与实验多态结构吻合,重现多态选择性
RibbonFold在多个经典淀粉样蛋白上的预测,展示了它不仅能准确预测出已知的多态构象,而且构象之间的相对稳定性排序(基于物理能量打分)也与实验结果一致。例如,在Aβ和Tau蛋白中,RibbonFold能区分出在不同溶解度和生理条件下形成的不同纤维类型,揭示多态结构的形成可能与环境选择压力有关。
更重要的是,团队利用RibbonFold对随机打乱的序列进行了系统性测试,发现尽管它们也能形成某种聚集构象,但这些构象在能量上显著不稳定且分布广泛,缺乏自然序列中观察到的“聚集倾向性”和“有限多样性”。这一发现提示,那更稳定、更不容易被溶解的结构最终会占据主导地位,从而也导致了淀粉样蛋白有限的多态性。
图2.RibbonFold结构预测重现淀粉样蛋白多态选择性
未来展望:从结构预测到功能发现
RibbonFold不仅仅是一个预测工具,它疾病机制探索和药物发现开启了多种新的可能性。
首先,它为揭示淀粉样疾病的分子机制提供了新手段。多态构象之间的转换可能是疾病进展中的关键步骤,RibbonFold提供了预测这些构象变换的可能通路。其次,它有潜力用于寻找药物作用位点。传统药物设计侧重于稳定天然折叠态,而RibbonFold提供了探索淀粉样蛋白构象空间的能力,可能帮助识别在某些多态结构中暴露但在其他多态结构中隐藏的“构象特异”位点,从而实现高特异性的靶向干预。第三,近期研究显示某些淀粉样蛋白具有催化功能,甚至在神经突触中参与记忆形成。RibbonFold能预测功能性淀粉样构象,有望推动功能性“类酶”材料设计和合成生物学的发展。最后,RibbonFold为将深度学习与物理知识结合提供了典范。通过引入结构约束、合理简化搜索空间,并关注多样性而非唯一结构,RibbonFold的理念也可推广至其他大尺度蛋白复合体的预测,甚至扩展至液-液相分离等动态聚集过程的建模中。
昌平实验室工程师郭良越,助理研究员余其林为共同第一作者;助理工程师王迪和吴小雨为本工作做出重要贡献;莱斯大学Peter Wolynes和昌平实验室领衔科学家陈明辰为该工作的共同通讯作者。