一维基因组“编码”三维基因组
[编者按] 一百多年来,交大人用知识和智慧创造累累硕果,谱写了近现代史上的诸多“第一”。这是人才培养的智慧、科学研究的智慧、服务社会的智慧、为国争光的智慧。新闻网特推出“交大智慧”专栏,聚焦交大人的智慧之光,展现交大人为国家发展和社会进步作出的重大贡献。
北京时间2015年8月14日,《细胞Cell》杂志发表了上海交通大学系统生物医学研究院比较生物医学研究中心吴强教授团队题为《通过CRISPR遗传编辑技术反转CTCF位点改变基因组拓扑结构和增强子与启动子功能》的研究论文。该研究阐明了从一维基因组线性DNA元件“组装”成三维基因组立体拓扑结构的自然规律以及其调控基因表达模式的分子机制。
DNA在细胞核中被有规律地“组织”起来形成立体的三维结构,这种组织结构提供了基因表达调控以及细胞发育与分化的结构基础。但这种复杂却很有规律的三维结构是如何被建立起来的呢?近日,上海交通大学吴强课题组给出了一个关键的答案。
该研究发现一种被称为CTCF的绝缘子结合蛋白识别其靶向DNA序列是具有方向性的,这种蛋白质识别DNA的方向性决定了染色质环化的方向性,从而形成染色质高级拓扑结构域,进而“辅助”一维线性的DNA元件“自组装”成立体的三维基因组,并调控基因表达,可能与多种人类疾病相关。日前,国际自然科学领域三大期刊之一的《细胞Cell》杂志发表了该研究成果。
一维基因组遗传信息编码三维基因组立体结构
十几年前人类基因组计划测序的工作就已全部完成,但是我们对于人类基因组的认识还远没有完成,我们仍处在人类基因组时代,而不是后人类基因组时代。人类基因组编码的遗传信息决定了组织器官发育和大脑功能,但是我们对人类基因组30亿碱基对序列中蕴藏的遗传信息的认识还远远不够。只有认识了人类基因组编码的本质规律,才能更好地推动转化医学研究,最终实现人类疾病的精准医疗。该研究为进一步认识三维基因组的结构和功能以及疾病发生发展奠定了重要基础,将推动转化医学研究,对疾病的临床精准医疗具有重要意义。
人类基因组包含十几万个绝缘子结合蛋白CTCF结合位点,CTCF蛋白通过结合这些位点参与建立复杂而有序的DNA相互作用网络。由于CTCF在DNA调控元件之间进行染色质环化中起到重要的连接作用,其被形象的称为“基因组的纺织工”。那么CTCF介导特异性DNA相互作用的分子机制是怎样的呢?
该研究揭示了细胞核中3D三维基因组的高级拓扑结构是如何由1D一维基因组中成千上万的DNA元件组装的,也就是说一维基因组的线性DNA序列信息能够编码三维基因组的立体结构。课题组利用前期开发的DNA片段CRISPR遗传编辑技术,通过原位反转CTCF位点,发现在原钙粘蛋白基因簇中,CTCF蛋白识别其靶向DNA元件具有方向性,这种蛋白质识别DNA调控元件的方向性决定了染色质高级拓扑结构域的建立和增强子与基因启动子的特异性相互作用,并影响基因的时空表达模式。随后,课题组在珠蛋白基因簇中进行了进一步的原位DNA片段遗传操作,发现位于上游正向的CTCF位点与位于下游反向的CTCF位点的DNA序列能够进行特异性长距离染色质环化,形成特异的染色质高级拓扑结构域,即基因组的线性一级结构能够决定其立体高级拓扑结构。最后,利用计算生物学方法揭示这个一维基因组线性DNA序列决定三维基因组高级拓扑结构的自然规律在整个人类基因组中具有普适性。总之,该研究工作该揭示了1D一维基因组中线性DNA元件的位置和方向”编码“3D三维基因组的立体高级拓扑结构。
图示:细胞核内三维基因组中有机折叠的拓扑结构域在正常发育和疾病发生中起到重要作用。人类基因组30亿碱基对中包含有十几万个CTCF位点,这些位点在一维基因组中的位置和方向决定细胞核中三维基因组的高级拓扑结构。
人类三维基因组立体结构调控基因时空表达模式与疾病息息相关
人类基因组的30亿碱基对大约有2米长,却有规律的折叠在直径约5微米的细胞核内,以完成所有的基因组“编码”功能。基因组的时空表达模式决定了组织器官的正常发育,而基因表达调控与三维基因组结构密切相关,包括癌症和自闭症、精神分裂症、抑郁症等遗传性相关疾病的发生发展都可能与不正常的三维基因组结构引起基因表达调控失调相关,因此研究三维基因组结构是国家重大需求和国际科学前沿,但我们对人类三维基因组结构的认识才刚刚起步。
人类基因组的DNA序列中蕴藏着远超出我们所想象的信息。在如基因组遗传编辑、高通量测序等现代生物学技术的辅助下,充分“解读”DNA遗传信息已成为可能。当能够真正“读懂”人类基因组遗传信息含义的时候,我们就能够“游刃有余”地预防、甚至精准治疗许多疾病或发育异常。
该研究揭示了在染色体自然状态中带有CTCF位点的增强子的方向决定染色质高级拓扑结构的形成和增强子与基因启动子的特异性环化,过去的研究利用报告基因检测方法发现基因的增强子不具有方向性,因此该研究与过去的认识形成反差,具有概念性进展。该研究还揭示了绝缘子保障增强子通过启动子调控组织和细胞特异性基因表达的分子机制。从另一个角度来说,一维基因组的DNA遗传信息“编码”了三维基因组中特异性的基因增强子与基因启动子相互作用,从而调控组织或细胞特异性基因表达模式。
该研究进一步阐明了在细胞核内的物理空间上决定基因调控元件中绝缘子、增强子或沉默子、启动子的关系,以及基因表达调控的分子机制。DNA遗传信息决定了CTCF蛋白的结合方向,CTCF结合方向决定了染色质环化的方向,从而决定了染色质的拓扑结构域和基因组的三维高级结构。该研究获得同行评审专家的高度评价,认为这一基因组三维高级结构组装机制的发现是一项重要工作,是认识三维基因组结构的第一步,具有原始创新性。
系统生物医学研究院吴强课题组前期建立了比较生物医学研究平台,能够高效、快速、精确地对小鼠基因组DNA片段进行遗传编辑,包括反转基因调控元件、敲除基因簇、重复DNA片段等,可以研究基因表达调控机理和蛋白质在体功能(Li et al., JMCB., 2015; Jia et al., MCB., 2014)。本研究建立在前期工作基础上,主要由博士研究生郭亚和硕士研究生许泉同学在吴强教授的指导下完成,研究团队其他成员在实验过程中积极参与协作,并做出重要贡献。本项目研究和发表过程中得到陈竺和张杰的关心。本研究还得到哥伦比亚大学、冷泉港实验室、加州大学圣地亚哥分校、清华大学和德克萨斯大学达拉斯分校的合作,并受得科技部和基金委资助。
论文链接:
http://www.cell.com/cell/abstract/S0092-8674(15)00915-0
相关评论链接:
http://www.sciencedirect.com/science/article/pii/S0092867415009691