人体内的每个体细胞基本上拥有相同的基因组,但在特定组织中执行不同的功能,其基因表达也各不相同。转录因子(TF)是一类通过结合DNA调控基因转录活性的蛋白质,它们与基因前启动子区域和远端增强子区域结合,调控基因表达、细胞分化及响应环境信号的发育过程(1)。全基因组范围内了解TF-DNA相互作用非常重要,因为TF结合的异常与发育障碍、癌症和神经退行性疾病等复杂疾病密切相关。
然而,在哺乳动物细胞中分析TF结合面临多重挑战,首先,TF的结合具有动态性和情境依赖性,会因细胞类型、发育阶段和环境条件而变化,因此需要在原代组织中以单细胞分辨率分析TF结合。其次,尽管TF能够识别相对短的序列基序,但仅凭基序并不能很好地预测TF的实际结合位点,需要实验数据进行验证。最后,哺乳动物基因组编码了数千个TF,而现有方法在扩展性、分辨率和通量方面存在不足,难以系统性地绘制不同细胞群体中TF占据的全景图。转录因子如何组合来协调基因调控网络仍是真核生物学中的一个核心问题,有待解决。
传统的TF与基因组DNA结合的鉴定方法,如染色质免疫沉淀测序(ChIP-seq)(2)、ChIP-exo(3)等,依赖于抗体,而抗体的质量和可用性差异很大,限制了这些方法的通用性。另一类常用方法,如DNase-seq(4),利用核酸酶切割来检测TF在DNA上的结合足迹,但这类实验通常需要大量细胞和深度DNA测序,限制了其在样本量较小或单分子TF结合事件解析中的应用。最近,虽然一些实验室已将胞嘧啶甲基转移酶M.CviPI和重亚硫酸盐测序结合,开发出单分子足迹测序技术(SMF)来测定TF的结合(5),但由于M.CviPI仅能甲基化GpC二核苷酸中的胞嘧啶,因此SMF只适用于没有内源性胞嘧啶甲基化干扰的生物系统,同时也只能检测含有GpC序列的转录因子且分辨率有限(7~14bp)。另一种单分子印迹方法Fiber-seq(6)利用N6腺嘌呤甲基转移酶和三代长度长测序技术来检测转录因子印迹和核小体定位,但由于其成本高、测序覆盖深度低以及6mA识别准确性不足,限制了其在全基因组TF结合检测中的应用。
为了应对这些挑战,2024年12月17日,昌平实验室/北京大学生物医学前沿创新中心谢晓亮课题组在PNAS上发表题为Genome-wide single-cell and single-molecule footprinting of transcription factors with deaminase的研究论文,报道了一种基于双链DNA脱氨酶的单分子印迹新技术,称为FOODIE(FOOtprinting with DeamInasE)。该方法用脱氨酶将细胞基因组DNA上胞嘧啶直接转化为尿嘧啶,在PCR扩增和二代测序后检测为胸腺嘧啶,而TF结合位点内的胞嘧啶不会被转化,从而实现对TF接近核苷酸的高分辨率印迹检测(图1)。FOODIE方法的优势在于其兼容广泛使用的二代测序平台,具有更低成本、更高的扩展性,并能够在单分子和单细胞层面进行分析,显著提高了检测转录因子结合的通量和分辨率。
图1. 开发FOODIE技术,实现转录因子结合位点的全基因组图谱绘制
为寻找适合转录因子印迹的双链DNA脱氨酶,作者筛选了多种脱氨酶,最终选择了高效,低碱基偏好性的新酶DddB用于开发FOODIE方法。考虑到TF通常结合在开放、易接近的染色质区域,作者将FOODIE与基于Tn5转座酶的片段化方法结合,从细胞中分离这些区域进行TF印迹分析。该简化流程稳健且易于使用,对细胞数量需求较低,适用于单细胞分析。以人类淋巴母细胞系 GM12878为例,作者展示了 FOODIE 技术在检测人类细胞全基因组范围内的转录因子印迹的准确性。相较于之前的方法,FOODIE 在灵敏度和分辨率上实现了显著提升。结合基序分析和ChIP-seq数据,作者确认了该细胞类型中79种TF的精确结合位点,并统计了这些转录因子在启动子和增强子区域中的结合数量及位置分布关系。作者进一步将 FOODIE 应用于存放于微孔中的单个哺乳动物细胞,单细胞 FOODIE (scFOODIE) 实现了在异质性组织样本中检测任意细胞类型中的 TF 结合状态(图2)。作者证明,scFOODIE 能够解析混合了四种人类细胞系(GM12878、K562、HEK293 和 HeLa)的 TF 结合模式,通过细胞特异性的开放染色质信号对细胞进行分类。随后,作者将 scFOODIE 应用于小鼠海马组织,分析了 11,200 个细胞中对应于 8 种主要细胞类型的 TF 印迹,为系统分析异质性组织细胞中的基因调控网络提供了强有力的工具。
图2. scFOODIE在异质性组织中进行细胞类型特异性的转录因子足迹分析
作者利用FOODIE研究了基因组开放区内两邻近转录因子组合的结合模式,探讨了TF结合之间的正相关(协同性)和负相关(排他性)。作者设计了一种计算算法,能够从FOODIE数据中量化TF协同作用(图3)。研究发现,基因组上两相邻的转录因子的结合协同作用表现出更多的正向协同作用而非负向协同作用。正协同作用表现为转录因子互相促进彼此与DNA的结合,通过高敏感性的 sigmoidal TF 浓度依赖性实现调控。而负协同作用则保证了在细胞核内TF浓度突然变化时,基因调控能够快速响应。深入了解不同细胞类型中的TF结合及其组合信息,能够为基因调控机制及细胞生物学功能的基础理解提供重要的线索和支撑。
图3. FOODIE 检测转录因子的结合比例及其协同作用
FOODIE 为哺乳动物细胞的转录调控程序提供了新的见解。研究表明,单个基因的表达是间歇性的(burst),这一现象归因于单细胞中 DNA 的单分子特性(7)。为了协调多个基因的表达以完成特定的生物学功能,它们之间的同步性非常关键。长期以来,研究人员一直致力于识别协同基因模块(CGMs),这些模块通过协作调控不同的生物过程(8)。作者推测,不同基因模块的协调通过一组共同的 TF 来实现。为了验证这一假设,作者研究了三种类型 CGM 中特定 TF 的富集情况。结果显示,管家基因 CGM 的启动子中以及组织特异性 CGM 的增强子中均有 TF 富集(图4)。基于这些分析,作者提出:具有基本细胞功能的基因依赖于启动子中的TF结合,以确保其稳健性,而组织特异性基因则更多依赖增强子,以实现更大的调节灵活性。这一发现有助于进一步理解细胞内基因调控的精细机制。
图4. 相同CGMs中的基因在启动子和增强子区域共享转录因子
为了便于交互式分析 FOODIE 鉴定的全基因组TF印迹,作者开发了一个用户友好的网络服务器(http://foodie.sunneyxielab.org)。未来,随着各种人类组织系统化 FOODIE 数据库的建立,对真核生物中转录调控和细胞功能的理解将得到进一步扩展。
综上,FOODIE是一种高精度的原位映射转录因子足迹的新方法,可在单细胞水平上以接近单核苷酸的高分辨率对全基因组范围内的转录因子进行印迹。与现有转录因子印迹检测方法相比,FOODIE具有多项关键优势。该方法易于实施,适应高通量流程且成本效益高。同时,FOODIE方法可以扩展到单细胞分辨率,适用于异质组织中的不同细胞类型分析,并能评估每个细胞群体中的TF结合模式。通过在各种组织中应用这些方法,可以揭示TF组合结合模式和基因调控模块。此外,FOODIE还能通过分析临床样本中TF印迹,识别疾病特异性调控特征,进一步深入了解转录调控在发育、进化及人类疾病作用。总体而言,FOODIE 是一项变革性的技术,能够大大加速几乎所有生物背景下的基因调控研究。
昌平实验室、北京大学生物医学前沿创新中心、北大-清华生命科学联合中心谢晓亮教授为该论文的通讯作者。北京大学生物医学前沿创新中心/昌平实验室副研究员何润生、昌平实验室副研究员董文阳、北京大学博士生王治、北京大学生物医学前沿创新中心/昌平实验室副研究员室谢忱、昌平实验室副研究员高龙、马文平为该论文的并列第一作者。北京大学博士生沈可、昌平实验室博士生李杜白、庞雨璇等为该论文做出了重要贡献。该研究项目得到了昌平实验室、科技部、北京未来基因诊断高精尖创新中心、北大-清华生命科学联合中心经费的支持。
专家点评
何川(芝加哥大学)
谢晓亮教授课题组多年来一直致力于发展高精度、单细胞、全基因组测序新方法,用于研究哺乳动物染色质构象和转录机制的基础问题。2024年12月在线发表的FOODIE技术,是该课题组开发的高精度全基因组转录因子结合位点测序新方法。FOODIE利用高效的双链DNA脱氨酶,能够系统性测量全基因组范围内的转录因子结合位点。该方法操作简便,具有高通量、低成本的优势,且能够应用于单细胞和单分子层面的分析。在脑组织样本中,FOODIE展现出了区分不同细胞类型以及研究转录因子相互作用的卓越能力,为未来深入研究哺乳动物复杂转录调控机制提供了一个非常有用的新技术。
朱冰(中国科学院生物物理所)
转录因子的友谊小船
转录因子作为DNA序列专一性结合蛋白,调控着基因的特异性表达。教科书中阐述的往往是一个简化的模型:某个转录因子识别某段DNA序列,激活或抑制其表达。然而,许多转录因子结合在基因组中数以万计的靶序列上,却只调控一小部分相关基因的表达。因此,真核生物转录领域的开创者Robert Roeder教授曾经有一句名言:Binding is NOT functioning。这背后的原因是什么?又怎样开展研究呢?
正如我们并非孤立存在于社会,转录因子也往往并非孤立存在于靶基因的调控元件上。基因表达的调控效果也往往并非由单个转录因子所决定,而是由多个转录因子的共同作用和染色质环境因素一起决定。因此,理解不同转录因子间的“友谊小船”,或者说它们在同一调控元件区域上的协同或拮抗作用是一个重要的研究方向。然而,这也是一个极具挑战性的研究方向,因为缺乏相关的研究工具。
近日,谢晓亮课题组在PNAS杂志上发表的研究论文为上述研究方向创建了开拓性的技术:FOODIE。该技术利用脱氨酶将基因组上的胞嘧啶C转化成尿嘧啶U,而转录因子结合位点内的胞嘧啶则能够逃脱这一反应,从而留下其足迹。根据转录因子的靶序列特征,就可以推断出位于同一DNA链上的各种转录因子间的协同效应和拮抗作用。重要的是,该技术可以在单细胞水平展开,从而为研究不同细胞在响应各类信号时展现的异质性提供了可能。
此外,FOODIE是一项流程简单、价格便宜的实用型技术,相信很快会被众多研究者应用到各种生物学场景中去。
论文链接
https://www.pnas.org/doi/10.1073/pnas.2423270121
参考文献
1.Lambert SA, et al. (2018) The Human Transcription Factors. Cell 172(4):650-665.
2.Robertson G, et al. (2007) Genome-wide profiles of STAT1 DNA association using chromatin immunoprecipitation and massively parallel sequencing. Nature Methods 4(8):651-657.
3.Rhee Ho S & Pugh BF (2011) Comprehensive Genome-wide Protein-DNA Interactions Detected at Single-Nucleotide Resolution. Cell 147(6):1408-1419.
4.Hesselberth JR, et al. (2009) Global mapping of protein-DNA interactions in vivo by digital genomic footprinting. Nature Methods 6(4):283-289.
5.Sönmezer C, et al. (2021) Molecular co-occupancy identifies transcription factor binding cooperativity in vivo. Molecular cell 81(2):255-267. e256.
6.Stergachis AB, Debo BM, Haugen E, Churchman LS, & Stamatoyannopoulos JA (2020) Single-molecule regulatory architectures captured by chromatin fiber sequencing. Science 368(6498):1449-1454.
7.Chong, S., Chen, C., Ge, H., & Xie, X. S. (2014). Mechanism of transcriptional bursting in bacteria. Cell, 158(2), 314-326.
8.Ma, W., & Xie, X. S. (2024). CGMFinder Identifies Correlated Gene Modules from 3H scRNA-seq Data. bioRxiv, 2024-11.