王勇研究组构建综合型的植物合成生物学元件库
2024年1月30日,中国科学院分子植物科学卓越创新中心王勇团队在Plant Communications杂志在线发表了题为"An Integrative Database and Its Application for Plant Synthetic Biology Research"的论文,构建了综合型的植物合成生物学元件库PSBD(https://www.bic.ac.cn/PSBD/front/#/)。该元件库针对植物合成生物学研究的需求,收录整合了1677个催化元件、384个调控元件、309个物种信息及850个化合物信息,并提供BLAST、化合物相似性分析、催化元件系统发育分析和调控元件强度可视化等在线工具,可用于植物底盘中的遗传电路设计、代谢通路设计及基因精细定量调控设计等。
生物元件是合成生物学研究中最简单、最基本的生物积块,通常是具有特定功能的核苷酸序列或氨基酸序列,如调控元件(操纵子、启动子、增强子、转录因子等)、外显子和蛋白质编码开放阅读框等。生物元件的设计和组装,是合成生物学设计与构建的基石。近年来随着合成生物学研究的深入发展,从简单的单细胞系统逐渐转向复杂的多细胞体系,植物合成生物学研究逐渐成为热点。植物底盘的多样化及其生长发育、代谢调控等性状的复杂性,使其有别于单细胞微生物体系。尽管组学研究揭示了植物基因组中蕴含的大量潜在元件资源,但是这些序列缺乏必要的实验表征,且未能进行标准化组装,很难满足合成生物学设计与构建的需求。迄今为止还鲜有专门针对植物底盘的合成生物学规模化元件库。
该工作所建立的植物合成生物学元件库包含了“催化元件”“物种”“分子”“调控元件”和“组学”五类数据信息(图1,A)。在PSBD中,任何一个元件、物种、分子的信息都可被视为一个数据节点,针对所有的数据节点都设置了相应的链接,使得它们形成一个网络(图1,B)。希望通过这种网络化的知识体系使得用户在选择自己合适的元件的过程中获得便利。在五大数据分类的基础上,按照元件特性进一步进行了分类(图1,C)。1677个催化元件按照其表征的功能可以分为19类,包括602个细胞色素P450,572个萜类合酶,392个UDP依赖的糖基转移酶,18个氧化还原酶等;按照代谢途径进行分类的话,867个催化元件涉及萜类途径,99个涉及类黄酮途径,112个涉及生物碱途径,56个涉及苯丙素途径。调控元件也根据其功能分为21类,包括112个转录激活结构域,114个启动子,19个DNA结合结构域,15个终止子,14个操纵子,8个5’UTR等。组学数据中包含了不同植物中的编码序列(CDS)及预测获得的功能序列,有助于挖掘更多潜在的植物元件。
除了元件数据外,PSBD还提供了4种分析工具。“BLAST”可用于在PSBD库中搜索同源基因或蛋白序列;“Phylogenetic Analysis”可用于分析目标序列与库中对应家族的催化元件的系统发育关系关系;“Chem Similarity”有助于搜索库中相似的分子及其相关的催化元件;“Visual Strength”统一将启动子与终止子的元件强度进行了梯度分类,用户可以按照表达盒的强度选择合适的调控元件。
对功能明确表征过的催化元件进行整合有助于预测一些感兴趣的基因的功能(图2,A)。论文中对新发现的TcTS2进行了BLAST分析和系统发育分析,结果显示TcTS2属于I型diTPS亚家族(图2,B)。其功能验证结果也证实了TcTS2能够催化紫杉二烯的合成,与TbreTS(PSBD_GENE000703)的功能完全相同。随后通过选择具有不同强度的调控元件,可以实现紫杉二烯在本氏烟草中的梯度合成,最高可达21.37±13.03 μg/g鲜重(图2,C)。这也证实了PSBD在预测元件功能和定量调控基因表达上的潜力。
“all in one”是PSBD的一大特色,综合型的元件资源对合成元件和遗传电路的设计、改造和优化提供了便利。基于PSBD中的调控元件构建出的转录信号变压器(transcriptional signal transformer,TST)能够将输入信号转化为不同的输出强度(图3)。基于VPR-TST表达的EGFP强度最高可以达到库中最强天然启动子P_StUbi的2.6倍。黄病毒非结构蛋白1(NS1)在本氏烟草叶片中的表达分析也证明了TST系统的普适性。该元件库的建立及后续的进一步充实将大大推进基于植物底盘的合成生物学相关研究。
中国科学院分子植物科学卓越创新中心王勇研究员和孙雨伟副研究员为该论文的通讯作者,田晨菲博士为论文第一作者,李建华、吴宇函、王光义、张翼鑫等人参与了该项研究。该研究得到国家重点研发计划、上海市学术带头人计划、国家自然科学基金、中国科学院先导项目及植物分子遗传国家重点实验室的资助。
论文链接:https://www.cell.com/plant-communications/fulltext/S2590-3462(24)00047-6
图1 (A)PSBD的内容框架(B)PSBD元件的数据网络图(C)物种、催化元件、调控元件、分子和组学数据的分类信息
图2 (A)CaseⅠ中PSBD的应用流程图(B)TcTS2与PSBD内TPS家族蛋白的进化关系分析(C)调控元件控制本氏烟草叶片中紫杉二烯的产量
图3 转录信号变压器(transcriptional signal transformer,TST)