首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 875 毫秒
1.
为了丰富多花黄精Polygonatum cyrtonema幼苗期根茎发育的转录组数据,发掘参与甾体皂苷生物合成的功能基因,为多花黄精活性成分的合成代谢途径与调控机制研究提供遗传资源,该研究基于Illumina深度测序平台,对多花黄精幼苗期根茎进行转录组测序及生物信息学分析,包括序列数据的组装拼接、unigene序列的功能注释、分类和代谢途径分析,并对次生代谢途径中甾体皂苷的生物合成通路进行深入解析。结果显示,多花黄精根茎的转录组数据经拼接共产生了126 546条unigene序列,其中47 226条被注释。共有16 499条unigene被定位到了KEGG数据库中的132个代谢通路,其中2 768条被鉴定出参与了22个次生代谢物生物合成通路。鉴定出的113条unigene序列,分别编码27个与甾体皂苷生物合成相关的代谢酶,与45个拟南芥酶基因同源。该研究从多花黄精转录组数据库中发掘到一系列与活性成分甾体皂苷生物合成相关的酶基因,对这些基因的深入研究,有助于从分子水平上解析多花黄精中甾体皂苷的生物合成途径。该研究也为多花黄精的转录组学研究提供了丰富的参考数据,对于多花黄精的功能基因组学研究具有重要意义。  相似文献   

2.
目的:利用高通量测序技术获得马鞭草Verbena officinalis L.的全长转录组基因信息。方法:通过PacBio Sequel高通量测序平台,对马鞭草根、茎、叶3个部位的混合样品进行全长转录组测序,并基于序列同源性对转录本进行功能注释,得到马鞭草全长转录组的遗传信息。结果:测序数据经过质控后获得197542个高质量的转录本及169063条环形一致性序列(CCS),检测出4955个转录因子。其中161062个(81.53%)转录本在非冗余蛋白(NR)、真核生物相邻类的聚簇(KOG)数据库、京都基因与基因组百科全书(KEGG)、基因本体(GO)数据库、蛋白家族(Pfam)数据库和SwissProt蛋白序列数据库中均得到注释。MISA分析发现54063个简单重复序列(SSR)位点,还预测到70050个长链非编码RNAs(lncRNAs)和45499个信使核糖核酸(mRNAs),并在马鞭草全长转录组中共鉴定到了60个转录本可能参与单萜类化合物的生物合成。结论:利用高通量测序技术和生物信息学分析获得了马鞭草的全长转录组信息特征,可为后期开展马鞭草功能基因鉴定、解析萜类化合物次生代谢途径及其调控机制提供参考。  相似文献   

3.
目的:获得菝葜Smilax china L.全长转录组数据,深入挖掘其功能基因。方法:采用PacBio Sequel测序平台,分别提取菝葜根、茎、叶3个部位的RNA,将样品等量混合后进行全长转录组测序及分析。结果:共获得转录本122324个,N50长度为1400 nt,鸟嘌呤和胞嘧啶(GC)占比为45.32%,其中92878个(75.93%)转录本在七大数据库中注释。非冗余蛋白(NR)注释中,与菝葜最相近的物种是海枣Phoenix dactylifera L.,匹配程度达17.39%;真核生物相邻类的聚簇(KOG)数据库注释中,比对到一般功能预测的转录本最多,有17875个;基因本体(GO)数据库注释中,66001个转录本分布于生物学过程、细胞组成和分子功能三大类的45个功能组;京都基因与基因组百科全书(KEGG)注释中,参与菝葜生物合成和其他次生代谢转录本4286个,其中参与黄酮类化合物生物合成的转录本1478个、参与皂苷生物合成的转录本162个、参与芪类化合物生物合成的转录本4个、参与其他有机化合物合成的转录本2642个。在基因结构分析中,共得到64612个编码序列、2003个转录因子。此外,简单序列重复(SSR)分析表明,33118个SSR中最多的优势重复单元为腺嘌呤(A)G/C胸腺嘧啶(T),同时还预测到44580个长链非编码RNA和28229个mRNA。结论:获得了菝葜全长转录组数据,可为深入研究菝葜生长发育、相关代谢途径、胁迫响应及生物遗传多样性提供数据支持。  相似文献   

4.
目的:发掘与岗梅乌索烷型三萜皂苷生物合成相关的酶基因。方法:利用Illumina 测序平台对岗梅根进行转录组测序,通过基因注释、同源分析、系统发生分析等生物信息学手段,发掘可能参与合成的单基因簇(Unigenes)。结果:在岗梅根转录组中发现了272 条与萜类生物合成相关的Unigenes。这其中包括72 条可能参与萜类生物合成上游途径的Unigenes,以及26 条可能与三萜合成途径下游母核合成、氧化和糖基化相关的Unigenes。对其中部分Unigenes 进行系统发生分析,进一步揭示了这些Unigenes 与同源基因间的进化关系。利用酵母表达系统,鉴定了两个香树酯醇合酶IaAS1 和IaAS2,其中IaAS1 为少数以α-香树脂醇为主要产物的香树酯醇合酶之一。结论:本文从岗梅根转录组数据库中发掘到一系列可能与岗 梅乌索烷型三萜皂苷生物合成相关的酶基因。对这些基因的进一步研究,有助于从分子水平揭示岗梅中乌索烷型三萜皂苷的生物合成途径。  相似文献   

5.
目的:获取广西莪术的全长转录组信息,了解其转录组的整体水平,挖掘姜黄素类生物合成通路基因。方法:利用Pacbio Sequel测序平台对广西莪术根、茎、叶、花4个部位的混合样品进行全长转录组测序,结合生物信息学等方法进行功能注释、代谢通路分析、简单序列重复(SSR)分析。结果:共获得原始数据14.47 Gb,经纠错、过滤、去冗余得到高质量一致性序列151218条。对所有转录本在非冗余蛋白(NR)、核苷酸序列(NT)、基因本体(GO)、真核生物相邻类的聚簇(KOG)、蛋白家族(Pfam)、京都基因与基因组百科全书(KEGG)和SwissProt七大功能数据库进行注释及分类,结果有128414个基因被注释,占比84.92%。共有325个基因参与姜黄素的生物合成,编码4-香豆酸-辅酶A连接酶、苯丙氨酸解氨酶、姜黄素合成酶、二酮-辅酶A合成酶、肉桂酸-4-羟化酶和咖啡酰辅酶A-O-甲基转移酶6个关键酶。MISA分析共发现32459个SSR位点,以单核苷酸重复数量最多,占全部重复类型的38.63%;1~3个核苷酸重复序列占主导位置,占总SSR位点的93.58%。结论:在高通量全长转录组水平对广西莪术进行研究,对姜黄素合成相关基因进行了挖掘,为后续阐明广西莪术姜黄素生物合成分子机制提供依据,为进一步研究广西莪术的分子标记和优良基因挖掘提供数据基础。  相似文献   

6.
目的:获得广州相思子Abrus pulchellus subsp.cantoniensis(Hance)Verdc.全长转录本。方法:利用PacBio Sequel测序平台,通过对广州相思子的根、茎、叶3个部位混合样品开展三代全长转录组测序,并对测序数据进行生物信息学分析。结果:共获得原始测序数据14.55 Gb,最终获得转录本序列172829条,N50长度为1572 nt,鸟嘌呤和胞嘧啶(GC)占比为40.86%。基因注释中,共有158888(91.93%)个转录本被成功注释;基因本体(GO)数据库注释中,102457个(59.28%)转录本分为生物学过程、细胞组成和分子功能三大类46个功能组;真核生物相邻类的聚簇(KOG)数据库注释中,一般功能预测的转录本最多,为22461个;信号转导机制、翻译后修饰、蛋白反转和分子伴侣亦为其主要功能途径;京都基因与基因组百科全书(KEGG)注释到转录本有99847个,其中参与广州相思子生物合成和其他次生代谢有4530个。基因结构分析中,共得到92344条编码序列,4800个转录因子隶属于59个转录因子家族。此外,简单序列重复(SSR)标记分析表明,40050处SSR位点中单碱基重复的SSR数目最多,其次是包含腺嘌呤(A)G/C胸腺嘧啶(T)的二碱基重复SSR。结论:获得的广州相思子全长转录组数据可为后续基因功能、代谢通路调控及分子标记开发等研究提供数据支撑。  相似文献   

7.
为了丰富金荞麦Fagopyrum dibotrys属植物的转录组数据,解析参与黄酮生物合成途径的关键酶基因,挖掘其功能基因,该研究利用BGISEQ-500测序平台对金荞麦的根状茎、根、花、叶和茎进行转录组测序,经过de novo从头组装转录本,共产生了205 619条unigenes, 132 372条获得7个公共数据库功能注释。其中81 327条unigenes比对注释到GO数据库,大部分unigenes注释在细胞过程、生物调控、结合和催化活性,86 922条unigenes富集在136个KEGG代谢途径,鉴定了82条unigenes参与编码黄酮类生物合成10个关键代谢酶。对金荞麦根状茎与根、花、叶和茎的差异表达基因(DEGs)进行分析,获得了27 962条共表达DEGs,有23 515条根状茎组织特异性表达DEGs富集132条KEGG代谢途径,而13条unigenes显著富集在黄酮和黄酮醇生物合成。此外,分析鉴定了3 427条unigenes参与编码60个转录因子(TFs)家族,有4条bHLH TFs富集在黄酮生物合成。该研究丰富了金荞麦属植物的转录组数据库,为植物黄酮生物合成关键酶的解析提供了参考,有助于从基因水平上进一步研究金荞麦黄酮生物合成关键酶的功能和调控机制。  相似文献   

8.
目的:获得广金钱草Desmodium styracifolium(Osb.)Merr.全长转录组数据,深入挖掘其功能基因。方法:采用PacBio Sequel测序平台,对广金钱草的根、茎、叶3个部位混合样品进行全长转录组测序及分析。结果:共获得转录本140069条,N50长度为1542 nt,其中118906个(84.89%)转录本被成功注释。非冗余蛋白(NR)数据库注释中,与广金钱草最相近的物种是豆科植物密花豆Spatholobus suberectus Dunn;真核生物相邻类的聚簇(KOG)数据库注释中,比对到一般功能预测的转录本最多,有18064个;基因本体(GO)数据库注释中,86459个转录本分布于生物学过程、细胞组成和分子功能三大类45个功能组;京都基因与基因组百科全书(KEGG)注释中,参与广金钱草生物合成和其他次生代谢转录本3721个。在基因结构分析中,共得到74174个编码序列、3663个转录因子。简单序列重复(SSR)分析表明,40456个SSR中腺嘌呤和鸟嘌呤(AG)/胞嘧啶和胸腺嘧啶(CT)、AAG/CTT分别是二碱基、三碱基中优势重复类型。结论:获得了广金钱草全长转录本,为其后续的分子研究提供数据支持。  相似文献   

9.
目的:获得天冬Asparagus cochinchinensis(Lour.)Merr.全长转录组数据库,为探索其活性成分生物合成提供参考。方法:利用RNA-Seq技术对天冬的根、茎、叶进行转录组测序并分析。结果:从天冬转录组中共获得169319条isoforms,最终有147762条isoforms在公共数据库中注释成功。非冗余蛋白(NR)数据库结果显示,天冬与石刁柏Asparagus officinalis L.同源性最高;真核生物相邻类的聚簇(KOG)功能注释信息334380条,可分为25个基因功能大类;京都基因与基因组百科全书(KEGG)通路富集分析显示,代谢相关的通路分布最多,为74095条。在注释到的54个转录因子家族中,MYB家族数目最多,共309条。在所有isoform中共检测到48042个简单重复序列位点,从单核苷酸到六核苷酸重复单元均有分布。结论:获得了较为可靠的天冬全长转录组数据,可为深入研究天冬生物学特性、相关代谢途径、信号通路及其分子机制提供数据支持。  相似文献   

10.
目的:利用全长转录组测序技术挖掘药用大黄蒽醌类成分合成中的关键酶Ⅲ型聚酮合成酶(PKSⅢ家族基因。方法:利用PacBio SequelⅡ平台进行药用大黄全长转录组测序,数据通过非冗余蛋白(NR)、SwissProt、京都基因与基因组百科全书(KEGG)、真核生物相邻类的聚簇(KOG)、基因本体(GO)数据库进行功能注释。筛选PKSⅢ家族基因全长并进行编码蛋白生物信息特征分析,借助MEGA 6.0构建PKSⅢ家族基因系统发育进化树。结合RNA-Seq数据分析,运用TBtools计算PKSⅢ家族基因的相对表达量。结果:共获得原始数据55.50 GB,52 960条高质量转录本,平均长度1 712.56 bp;50 007条Isoforms在NR、Swiss-Prot、KEGG和KOG数据库中得到注释。GO分类注释到生物过程、细胞组分和分子功能3个类别的65个小组。KEGG代谢通路共有17 637条转录本被注释于137条通路中,其中标准次生代谢通路15条。筛选到16个含开放阅读框的Isoforms,编码8个PKSⅢ家族基因,包括RoALS1-3 (芦荟松合酶)、RoCHS1-3 (查耳酮合酶...  相似文献   

11.
目的:构建药用植物青葙全长转录组,旨在为青葙功能基因组学研究提供遗传信息。方法:基于PacBio Sequel平台对青葙的根、茎、叶、花、果5个部位的混合样本进行高通量测序,对原始数据进行校正、筛选、聚类、去冗余、过滤、功能注释和结构分析,获得青葙全长转录组数据。结果:经质量控制后获得高质量测序reads数据量为13.46 Gb,拼接去冗余后获得155300条循环一致性序列(CCS),研究共获得521928个高质量isoforms和210189个转录本。利用非冗余蛋白(NR)、核苷酸序列(NT)、SwissProt、京都基因与基因组百科全书(KEGG)、真核生物相邻类的聚簇(KOG)、蛋白家族(Pfam)、基因本体(GO)7个数据库进行全长序列的功能注释,结果显示共有158562个转录本被成功注释。GO注释结果显示,转录本共富集在包含生物学过程、细胞组成和分子功能三大类的47个条目中。KEGG分析显示,转录本注释到代谢通路中的基因较多,其次是基因信息过程。基因结构分析结显示,共得到8350条蛋白质编码序列(CDS)、88574条lncRNA、45535个简单序列重复(SSRs),其中单核苷酸重复的占比最大,为52.94%,此外预测得到57类转录因子,如常见的MADS、WRKY、AP2-EREBP、bHLH等类型。结论:获得了青葙的全长转录组数据,为该植物后续分子功能研究提供了遗传信息和基础数据。  相似文献   

12.
目的:获得九里香Murraya exotica L.Mant.全长转录组数据库,为深入挖掘其全长基因信息提供参考。方法:利用Pacino Sequel平台的第三代测序技术,对九里香的根、茎、叶、花、果混合样品进行全长转录组测序,并对原始转录组数据进行分析。结果:共获得94435个转录本,平均长度为76476.23 bp,80583条环形一致性序列,通过聚类、校正和去冗余后最终得到108443个高质量的isoforms,其中在非冗余蛋白(NR)、核苷酸序列(NT)、基因本体(GO)、真核生物相邻类的聚簇(KOG)、蛋白家族(Pfam)、京都基因与基因组百科全书(KEGG)和SwissProt共注释了100219个isoforms,同时检测出34182个简单序列重复(SSR)位点,其中18482个单核苷酸数量占主导位置;检测了2574个转录因子,29592个长链非编码RNAs(lncRNAs)和30322个mRNAs。结论:获得了较为可靠的九里香全长转录组数据,为深入研究九里香的生长发育、相关代谢途径、功能基因利用、基原物种鉴定等提供数据参考。  相似文献   

13.
目的:获得越南槐Sophora tonkinensis Gagnep.全长转录组数据,为深入挖掘越南槐功能基因提供参考。方法:采用PacBio Sequel高通量测序系统,对越南槐根、茎、叶、果4个部位的混合样品进行全长转录组测序及分析。结果:共获得214159条环形一致性序列(CCS),获得208156个高质量isoforms,并在非冗余蛋白(NR)、核苷酸序列(NT)、基因本体(GO)、真核生物相邻类的聚簇(KOG)、蛋白家族(Pfam)、京都基因与基因组百科全书(KEGG)和SwissProt数据库中共注释了170150个isoforms,检测出4055个转录因子和38445个简单重复序列,预测到80041个长链非编码RNAs(lncRNAs)和39817个mRNAs。结论:获得了较为可靠的越南槐全长转录组数据,可为深入研究越南槐生物学特性、相关代谢途径、信号通路及其分子机制提供数据支持。  相似文献   

14.
林青  贠小芸  官慧儿  纪晓宇  徐晖 《中草药》2019,50(11):2683-2689
目的药用植物岗梅Ilex asprella含有多种活性磺化三萜类成分,克隆岗梅中的磺酸基转移酶编码(sulfotransferase,ST)基因,以了解其独特的磺化机制。方法利用RT-PCR技术,由岗梅叶片RNA扩增获得了2个可能的磺酸基转移酶基因IaST1和IaST2,利用生物信息学工具对其进行分析,并将其转化至大肠杆菌E. coli进行原核表达。结果序列分析显示,IaST1与IaST2各包含1个开放阅读框,分别长1002bp和993bp,编码333和330个氨基酸,理论相对分子质量为55500和54700。二者均具有ST的5个保守结构氨基酸序列,与黄顶菊Flaveriabidentis的黄酮醇C-3磺酸基转移酶亲缘关系较近。SDS-PAGE显示在E. coli中成功表达了IaST1和IaST2蛋白。结论首次从岗梅中克隆了ST基因,为后续阐明其功能及其在岗梅三萜磺化中的作用奠定了基础。  相似文献   

15.
孙婷婷  邹莉  张林芳  张国权  杨苑艺  李晶莹 《中草药》2015,46(18):2768-2773
目的对参与桑黄三萜合成途径的关键酶鲨烯环氧酶(squalene epoxidase,SE)进行基因全长克隆和生物信息学分析。方法以桑黄总RNA为模板,采用RT-PCR和RACE技术克隆桑黄SE基因的全长c DNA和DNA序列,并通过Ex PASy在线分析等方法对其进行生物信息学分析。结果序列分析表明,SE基因全长2 145 bp,包含6个外显子和5个内含子;所克隆的c DNA全长为1 856 bp,包含1个1 452 bp的开放阅读框,编码483个氨基酸的蛋白,命名为Ib SE1,预测该蛋白的相对分子质量为5.3×104,等电点(p I)为8.41,无信号肽。结论首次克隆并获得桑黄鲨烯环氧酶基因全长序列,为进一步阐明桑黄三萜代谢途径和改善中药材品质奠定基础。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号