传承创新 揭开构建玉米多维网络图谱时代序幕
2022年12月30日,《自然-遗传》杂志在线发表了本组研究生田智辉参与合作研究论文“A multi-omics integrative network map of maize”。该研究对参考自交系B73全生育期不同组织/时期的样品进行多维组学大数据测定,获得了31个不同组织或发育时期的mRNA-Seq数据、21个不同组织或发育时期的circRNA-Seq、sRNA-Seq数据和21个组织的Ribo-Seq数据。同时,使用高通量酵母系统RLL-seq构建了玉米蛋白互作网络,获得了36万多个蛋白-蛋白互作对,高置信度的互作有56243个。整合已有的基因组水平ChIA-PET网络与本研究产生的转录组水平共表达网络、翻译组水平共翻译网络和蛋白互作网络,构建了玉米第一代多组学整合网络图谱,涉及到两百万个互作关系。
图1 玉米第一代多维组学网络图谱
生物育种是农业的基础与核心,基因组育种技术是我国生物育种共性关键核心技术。生物育种经历了经验育种、分子标记育种、全基因组选择育种几个不同发展阶段,正在大踏步向基因组智能设计育种时代进军。无论生物育种处于哪个阶段,都离不开控制生物遗传变异的功能基因克隆与分子机制解析。经典的遗传学与分子生物学手段对重要性状的某个单一重要位点进行定位、克隆、分子互作实验,从而明确重要目标基因的上游调控基因、分子伴侣、以及下游的靶位点,进而构建功能基因的调控网络,最终解析一个基因控制重要性状变异的分子机制。经典的方法行之有效,克隆并解析了一批重要的功能基因。然而,即便是在功能基因组提出了二十几年的今天,水稻和玉米中克隆的功能基因仍不足其所有基因的10%,而且已经克隆基因的新功能还不断被发现。如何快速克隆功能基因并解析重要性状变异的分子机制,并从全局解析重要作物的遗传变异的奥秘,仍然挑战巨大,也是迈步智能设计育种时代的重要制约因素。
生物学研究已进入生物大数据时代。基于生物大数据,从全局水平构建所有基因的上下游及分子伴侣网络已经成为可能,为我们全局解析尽可能多的基因功能进而全面破解生物遗传变异的奥秘提供了前所未有的机会。项目负责人李林从2013年底就开始谋划设计,拟从多维组学的角度构建各个尺度以及介尺度水平的基因与基因调控网络,从而全面解析生物遗传奥秘。李林2016年回国成立实验室后,联合华中农业大学杨芳课题组与严建兵课题组,正式拉开了在基因组、转录组、翻译组、以及蛋白组学等水平构建玉米多维网络图谱的序幕。
网络大数据之剑 破解基因复杂功能网络
一个生命体内部的基因,就与人类社会中人非常相似。要确定一个人在人类社会中的社会价值,在社会学中不仅要看这个人所处在的家庭关系是什么,与什么人结婚、亲属关系是什么;也要看这个人的朋友圈如何,他/她与谁是朋友关系;同时也要看它工作的同事是谁,在什么公司工作。通过家庭亲属关系、朋友圈关系、以及工作圈的关系等,就可以了解这个人的社会价值与贡献。玉米第一代多组学整合网络图谱,就是描述玉米全局基因不同层级关系的图谱。了解了全局关系图谱,就会对全局基因的功能有系统的理解,进而就可以系统解析性状遗传变异分子机制。该研究经过6年的努力,研究者锻造出了生物网络大数据之剑,为全面系统解析玉米遗传变异机制奠定了基础。
基于成功构建的玉米多维网络大数据图谱,该研究在全基因组水平探究了重复基因在网络中的功能分化,发现不同类型的重复基因以及不同年代的重复基因的功能分化存在显著不同,揭示出玉米两个远古亚基因组从转录组到蛋白互作组表现出渐进式的功能分化;同时,重构了玉米已经克隆的株型功能基因、籽粒品质以及籽粒大小相关功能基因的分子网络,并成功预测出影响目标性状的新基因与分子网络。有意思的是,尽管不同课题组克隆的玉米籽粒大小相关功能基因来源不同,但是这些籽粒大小功能基因都显著富集在玉米多维组学整合网络图谱中,并系统鉴定出6个子网络协同调控玉米籽粒发育。
图2 基于玉米第一代多维组学网络图谱对玉米籽粒发育的分子机制进行解析
小试牛刀 破解玉米花期遗传变异奥秘
为进一步利用数以百万计的分子调控网络关系来解析玉米复杂数量遗传性状遗传的奥秘,作者进行了大量基于人工智能算法的探索与尝试。以玉米重要农艺性状开花期为例,开发了多个玉米开花期功能基因预测的人工智能算法,对玉米第一代整合多组学网络大数据进行挖掘,预测了2,651个候选的开花期基因,划分为8个子网络途径,覆盖了过去研究所报道的关键网络,同时鉴定出一个玉米中全新的调控开花期的分子途径,涉及到组蛋白乙酰化转移酶调控。从鉴定出来的8个开花期子网络中,挖掘出近100个关键候选开花期基因,通过CRISPR基因编辑技术与EMS突变技术创制其突变体。多年多点的大田种植开花期候选基因的突变体与其野生型材料,进行遗传表型鉴定,确定了20个预测基因与开花期性状相关,并对其分子机制进行了初步阐释,加深了对玉米开花期的理解,为开花期的智能设计育种提供了理论基础与基因资源。
图3 利用人工智能算法系统解析玉米开花期遗传机制
Abstract
Networks are powerful tools to uncover functional roles of genes in phenotypic variation at a system-wide scale. Here, we constructed a maize network map that contains the genomic, transcriptomic, translatomic and proteomic networks across maize development. This map comprises over 2.8 million edges in more than 1,400 functional subnetworks, demonstrating an extensive network divergence of duplicated genes. We applied this map to identify factors regulating flowering time and identified 2,651 genes enriched in eight subnetworks. We validated the functions of 20 genes, including 18 with previously unknown connections to flowering time in maize. Furthermore, we uncovered a flowering pathway involving histone modification. The multi-omics integrative network map illustrates the principles of how molecular networks connect different types of genes and potential pathways to map a genome-wide functional landscape in maize, which should be applicable in a wide range of species.