首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 215 毫秒
1.
王昊  陈挺 《生物信息学》2021,19(1):26-34
DNA测序是生物信息学研究的重要内容之一,对测序序列的从头拼接是其中非常基础而重要的步骤。随着测序技术的不断更新,新的第三代测序数据拥有更长的序列长度、高错误率等性质,针对这些性质,同时使用二代、三代测序数据进行混合拼接是获得更好的拼接结果一种重要方式。本文介绍了现有的混合拼接软件的基本原理,并比较了不同软件拼接结果。最后,本文对选择拼接软件以及提出新的混合拼接方法的研究方向给出了建议。  相似文献   

2.
二代测序技术由于通量高、读长适中、错误率较低及成本低等优点而备受广大科研人员的青睐。本文从7种烟草属植物的基因组测序、宏基因组测序、转录组测序及烟草病毒的检测与鉴定等4个方面对二代测序技术在烟草中的应用进展进行了详细的综述,并在此基础上对二代测序技术及三代测序技术在烟草行业中的应用前景进行了展望,以期为相关领域研究者提供新的思路。  相似文献   

3.
采用二代和三代测序技术分别对金针菇单核体菌株“6-3”进行测序,应用4种组装策略进行基因组的de novo组装,对比组装效果。基因组组装的参数方面,仅使用二代测序组装的效果最差,长度大于10kb的Contig全长只有24.6Mb,Contig N50只有23kb,组装率只有59.27%。采用三代组装二代校正的组装策略效果最好,长度大于10kb的Contig全长为38.3Mb,Contig N50为2.8Mb,组装率高达92.16%。保守单拷贝基因拼接效果方面,4种组装策略获得基因组序列与BUSCO数据库里的担子菌的保守单拷贝基因比对,基因完整性均大于94%。在组装准确性方面,经过PCR扩增、Sanger测序验证,三代组装二代校正的基因组序列完整并且连续,同时序列上碱基的SNP、InDel数量最少。综上所述,三代组装二代校正得到的基因组序列具有Contig N50值大、组装率高、碱基准确性高的特点,是食用菌基因组测序较为理想的方案。  相似文献   

4.
遗传病的防治是公共卫生领域的重大课题,而明确病因是遗传病防治的重要环节。高通量测序技术(又称二代测序技术)具有高通量、低成本、高准确度的优点,为遗传诊断及咨询提供了直接证据,已成为遗传学检测不可或缺的有力工具;第三代测序也凭借其长读长的独特优势在临床应用中占据一席之地。二代及三代测序技术各有特点,互为补充,临床中针对不同的检测需求有多种类型的测序方案可供选择。基于此,对二代及三代测序技术的原理、分类及其在遗传学诊断中的应用进展做一综述,以期为临床测序方案的选择提供思路和指导。  相似文献   

5.
微生物在人类生活中无处不在, 过去人们对微生物的认识仅停留在单菌培养和定性研究上, 而测序技术的发展极大地促进了微生物组学的研究。越来越多的证据表明: 人体共生微生物、特别是肠道微生物与人类健康息息相关。 二代测序技术凭借其高通量、高准确率和低成本的特点, 成为微生物组学研究中的主流测序技术。但是随着研究的深入, 二代测序技术的短读长(< 450 bp)增加了后续数据分析和基因组拼接难度, 也限制了该技术在未来研究中的应用。在此背景下, 第三代测序技术应运而生。第三代测序技术又称单分子测序, 能够直接对单个DNA分子进行实时测序, 而不需要经过PCR扩增。第三代测序技术的平均读长在2-10 kb左右, 最高可以达到2.2 Mb, 实现了长序列的高通量测序。凭借其超长的测序读长、无GC偏好性等优势, 三代测序技术为微生物基因组全长测序, 组装完整可靠的基因组提供了新的方法。本文在描述三代测序的技术特点和原理的基础上, 重点介绍了三代测序技术在微生物16S/18S rRNA基因测序、单菌的基因组组装以及宏基因组中的研究应用和进展。  相似文献   

6.
李文轲  李丰余  张思瑶  蔡斌  郑娜  聂宇  周到  赵倩 《遗传》2014,36(6):618-624
二代测序技术的发展对测序数据的处理分析提出了很高的要求。目前二代测序数据分析软件很多, 但是绝大多数软件仅能完成单一的分析功能(例如:仅进行序列比对或变异读取或功能注释等), 如何能正确高效地选择整合这些软件已成为迫切需求。文章设计了一套基于perl语言和SGE资源管理的自动化处理流程来分析Illumina平台基因组测序数据。该流程以测序原始序列数据作为输入, 调用业界标准的数据处理软件(如:BWA, Samtools, GATK, ANNOVAR等), 最终生成带有相应功能注释、便于研究者进一步分析的变异位点列表。该流程通过自动化并行脚本控制流程的高效运行, 一站式输出分析结果和报告, 简化了数据分析过程中的人工操作, 大大提高了运行效率。用户只需填写配置文件或使用图形界面输入即可完成全部操作。该工作为广大研究者分析二代测序数据提供了便利的途径。  相似文献   

7.
测序技术的不断发展使二代测序技术在测序通量提高和读长增加的同时,成本也大幅度降低。目前二代测序技术已广泛应用于生命科学各领域研究中,并且也逐渐受到法医学者的关注。文中主要阐述了二代测序技术在法医学实践中常见的微量、降解及混合等疑难生物检材DNA检验中的研究进展,对其未来的发展进行了展望,并提出了可能面临的挑战。  相似文献   

8.
黄唇鱼(Bahaba flavolabiata)为国家二级重点保护野生动物、IUCN(世界自然保护联盟)红色名录的极度濒危物种(CR)。基于其样本数量极其有限,全基因组研究可以提供大量与重要性状相关的功能基因和分子标记,从而揭示其重要生命现象的遗传机制。采用二代测序技术于2018年5月完成了黄唇鱼基因组精细图的测序,分析结果表明,测序得到约202 Gb的高质量数据,总测序深度约为317×;组装得到的基因组大小为637.43 Mb,Contig N50约为88 Kb,Scaffold N50约为4.65 Mb;重复序列约142.72 Mb,占比22.39%,预测得到23743个基因、920个t RNA、85个rRNA、176个假基因;98.46%的基因可以注释到NR、GO等数据库中;有67个基因家族是黄唇鱼所特有的。本研究从单碱基错误率、核心基因完整性及二代Reads比对分析3个方面对黄唇鱼基因组精细图的组装结果进行了评估,结果显示所组装的基因区的完整性较好。黄唇鱼基因组序列图谱的绘制完成,对于黄唇鱼自然资源的保护和种质资源挖掘具有极其重要的科学意义。  相似文献   

9.
真菌基因组较其他真核生物基因组结构简单,长度短,易于测序、组装与注释,因此真菌基因组是研究真核生物基因组的模型。为研究真菌基因组组装策略,本研究基于Illumina HiSeq测序平台对烟曲霉菌株An16007基因组测序,分别使用5种de novo组装软件ABySS、SOAP-denovo、Velvet、MaSuRCA和IDBA-UD组装基因组,然后通过Augustus软件进行基因预测,BUSCO软件评估组装结果。研究发现,5种组装软件对基因组组装结果不同,ABySS组装的基因组较其他4种组装软件具有更高的完整性和准确性,且预测的基因数量较高,因此,ABySS更适合本研究基因组的组装。本研究提供了真菌de novo测序、组装及组装质量评估的技术流程,为基因组<100 Mb的真菌或其他生物基因组的研究提供参考。  相似文献   

10.
谭聃  欧铜 《生物工程学报》2022,38(9):3121-3130
Sanger测序法,又称第一代测序技术,作为测序金标准推动了人类基因组“工作框架图”的绘制,但通量低、成本高的缺点限制了其进一步大规模应用。第二代测序技术,又称下一代测序技术,因其通量高、成本低等优点使得基因测序在基础研究与临床诊疗中得到广泛应用,但短读长一直是其不可回避的技术短板。第三代测序技术的出现,因其具有长读长优势,为基因序列上复杂重复区域解析与高质量基因组组装提供了新的技术手段。近年来,第三代测序技术进一步发展与完善,同时在肿瘤、免疫、生殖等相关领域逐步体现出临床应用价值。本文将综述第三代测序技术的研究进展与临床应用。  相似文献   

11.
宋琳琳  顾朝辉  韦朝春  陈赛娟 《生物磁学》2009,(15):2899-2902,2912
目的:针对下一代测序数据量大、序列长度短的特点,研究数据分析和质量评估方法。方法:选择已发布的Illumina-Solexa平台测序数据为研究对象,通过MAQ软件将测序数据与人类全基因组序列进行比对,并以外显子区域为例,在位点水平对测序数据质量进行评估。结果:结合已有软件系统和本文自创线性算法,建立了一套包括比对、拼接在内的测序数据质量评估系统。比对分析后,发现原始测序序列共覆盖了127,113,378个位点,涉及24条染色体上的64868个外显子。其中,每个位点都被测到的外显子为0.50%,位点平均测序深度大于等于1的外显子为3.98%。结论:成功构建了基于Illumina-Solexa测序平台的数据分析和质量评估方法,其可适用于其它第二代测序平台。研究者可在质量评估的基础上完善测序试验设计,并进行SNP和突变筛选及后续功能性研究。  相似文献   

12.
转录本组装是基于第二代测序技术研究转录组的关键环节,其质量好坏直接影响到下游结果的可靠性,也是目前的研究热点与难点。转录本组装方法可以分为Genome-guided和de novo两类,它们在理论基础与算法实现方面各有优劣。转录本组装质量的高低依赖于PCR扩增错误率、第二代测序技术准确率、组装算法和参考基因组完整性等方面,而现有的算法还无法完全处理由这些因素带来的影响。本文从转录本组装方法与软件、影响组装质量的因素和对组装质量的评价指标等方面进行讨论,以期能指导纯生物学家对分析软件的选择。  相似文献   

13.
新一代测序技术的研究进展   总被引:3,自引:0,他引:3  
大规模DNA测序技术是揭秘人类和其它生物遗传密码的重要技术,在分子生物学和基础医学领域有广泛应用。第二代测序技术的出现使DNA测序的通量大幅提高,测序的成本大幅下降,原来只有在大型测序中心才能完成的测序任务现在已经可以在更多的实验室展开。但是,早期的第二代测序技术仍然存在诸如文库构建过程复杂、测序成本依然较高等缺点。为了克服上述缺点,近三年发展了几种新的第二代和第三代测序技术,这些技术不仅继承了早期第二代测序技术通量高的优点,而且在文库构建等方面取得了重要突破,进一步简化了测序操作,降低了测序成本,缩短了测序时间。本文就几种最新的大规模测序技术的原理、特点与发展趋势进行简要介绍。  相似文献   

14.
多重PCR甲基化靶向测序数据尚缺乏针对性的比对软件。本研究评估了9种比对方案在处理多重PCR甲基化靶向测序数据时的性能,包括平均CPU运行时间、平均最大内存、平均比对率、 F1分数、平均比对速率、比对未通过率和差异甲基化位点,以及比对率受亚硫酸氢盐转化率和测序错误率的影响。本研究建立了打分系统以综合评价比对方案的优劣,结果显示,排名前三的方案依次为Bismarkbwt2(8.098分)、 BWA-meth(7.846分)和Bismarkbwt1(7.840分)。这三个方案的F1分数均为1.000,且在不同亚硫酸氢盐转化率和测序错误率下的比对率表现最优。此外,Bismarkbwt2还对应最多的差异甲基化位点和最低的比对未通过率,并在平均最大内存和平均比对率两项指标上表现良好。因此,本研究推荐Bowtie2模式下的Bismark作为后续搭建多重PCR甲基化靶向测序生物信息学分析流程的比对软件。  相似文献   

15.
人类白细胞抗原(human leukocyte antigen,HLA)的高分辨率、精准分型对于组织配型以及HLA相关疾病研究具有重要意义。本研究以12位原发性肝细胞癌病人的外周血为供试样本,分析二、三代测序数据用于高分辨率HLA分型的优劣势,同时结合探针捕获与三代测序技术对YH、HeLa标准细胞系以及一个原发性肝细胞癌病人的主要组织相容性复合体(major histocompatibility complex,MHC)区域进行靶向分析,探究长读长测序技术对于整个MHC区域精细分析的潜力。研究表明:(1)二、三代测序技术均能实现6~8位高分辨HLA分型,且两者分型结果一致。但是三代数据的覆盖均一度显著优于二代,不会出现明显的"断层"现象;(2)超长的三代数据可直接跨越整个扩增子,对于基因单倍体型的判定(phasing)具有明显优势。样本中92.79%的HLA基因能够得到准确的单倍体分型结果,远高于二代的75.65%;(3)长读长的三代测序数据不但能实现对MHC区域的更好组装,还具有对整个MHC共计3.6 Mb区域进行phasing的能力,而这将有助于明确各个突变位点、等位基因、非编码区等基因原件在每个MHC单倍体型上的定位与相互连锁信息,为免疫等相关疾病的研究提供理论依据。  相似文献   

16.
文章阐述了以单分子实时测序和纳米孔技术为标志第三代测序的基本原理,介绍了Helicos的Heliscope单分子测序仪、Pacific Bioscience的SMRT技术和Oxford Nanopore Technologies公司正在研究的纳米孔单分子测序技术。与其他测序技术进行了简单的对比以并提出一些单分子测序仍需面对的问题以及对未来单分子测序的展望。  相似文献   

17.
厚朴为著名的传统药用植物,归于木兰科、木兰属,于我国广泛种植,其树皮、根皮、枝皮、叶片、花、果实均能入药或食用。为获取厚朴全基因组序列信息,该文以厚朴叶片DNA为材料,采用Pacbio Sequel第三代测序技术构建厚朴全基因组数据库,并利用生物信息学方法对获得的核苷酸序列进行组装、功能注释以及进化分析研究。结果表明:(1)原始测序数据过滤后获得140.91 Gb三代数据,Read N50约为13 784bp,经过组装得到厚朴基因组大小为1.68 Gb,Contig N50约为222 069 bp,单拷贝基因完整性为81.0%。(2)组装后的序列通过与NR、KOG、KEGG等功能数据库比对,共有98.40%的基因得到了功能注释,其中KOG功能注释结果发现厚朴的蛋白功能主要集中在一般功能预测、翻译后修饰、蛋白质转换、伴侣以及信号转导机制; GO功能分类表明厚朴的基因集中在细胞组分及生物学过程; KEGG分析发现厚朴参与代谢通路的基因占主要地位。(3)通过与葡萄、拟南芥、水稻、杨树、银杏、无油樟、茶树及牛樟基因组的比对分析,发现厚朴23 424个基因中有20 801个基因可以分类到12 129个家族,其中有515个基因家族为厚朴所特有,而厚朴与牛樟(樟科)亲缘关系较近,两者的分化时间约在122.5百万年前(mya)。该研究首次利用第三代测序技术对厚朴全基因组解析,有利于对其进一步进行深入的开发与利用,也为研究其他药用植物全基因组奠定了基础。  相似文献   

18.
摘要:目的 探讨高通量二代测序技术在筛选感染性新生儿高胆红素血症病原菌中的应用价值。方法 运用高通量二代测序技术筛选22例感染性新生儿高胆红素血症患者的病原菌,同时进行传统细菌培养鉴定,比较二者的区别。结果 高通量二代测序技术检测病原菌阳性率为100.00%,传统细菌培养检测阳性率为0.00%。高通量二代测序技术筛选出的感染性新生儿高胆红素血症主要病原菌为Anoxybacillus kestanbolensis、Geobacillus vulcani、Klebsiella oxytoca和Acinetobacter guillouiae。结论 高通量二代测序技术具有高通量、高特异性、高准确度和快速等特点,适合临床患者病原菌的检测。  相似文献   

19.
稻瘟病和白叶枯病是由稻温病菌(Magnaporthe oryzae)和白叶枯病菌(Xanthomonas oryzae pv.oryzae)引起的两种主要水稻病害,也是制约中国水稻生产的主要病害。为了从DNA水平探索造成水稻感病品种‘丽江新团黑谷’(LTH)和高抗品种‘特特普’(Tetep,TTP)间抗病性差异的分子基础,该研究对其已知的3个抗稻瘟病基因和3个抗白叶枯基因所在DNA区段分别进行PCR扩增,将等量混合的PCR产物再与基因组重测序样品按Ct值差值(ΔCt)~10的比例混合,采用二代测序技术进行一次性测序和比较分析,并对有差异的基因区域进行常规传统测序验证,以确定这2个品种中抗性基因(R基因)的数目和结构与品种抗病或感病表型的关联性。实验结果表明,二代测序能够快速并准确地寻找到2个不同水稻品种中多个特定基因的序列差异,且差异位点与常规测序结果相符。从LTH和TTP这2种抗性不同水稻品种在多个抗性基因的DNA水平差异来看,有差异的抗性基因位点在高抗品种TTP中大都与原始抗性基因序列相同,而对应的普感品种LTH的抗性基因往往多表现为氨基酸突变,这些序列差异很可能就是导致TTP与LTH抗性差异的分子基础。  相似文献   

20.
以美洲大蠊Periplaneta americana为原料生产的康复新液等药品临床疗效显著,得到了广泛应用。本文以四川好医生攀西药业有限责任公司饲养的药用美洲大蠊为材料,首次采用Illumina Hi Seq 2000和Pac Bio SMRT测序平台开展了全基因组测序,并进行基因组组装、注释和分析。原始测序数据经过滤后得到1.4 Tb的二代测序数据和33.81 Gb的三代测序数据。组装结果表明,美洲大蠊基因组大小为3.26 Gb,这在已报道的昆虫基因组中仅次于东亚飞蝗Locusta migratoria。基因组重复序列含量为62.38%,杂合度为0.635%,表明其为复杂基因组。组装的Contig N50和scaffold N50长度分别为28.2 kb、315 kb,单拷贝基因完整性为88.1%,小片段文库测序数据平均比对率为99.8%,测序和组装质量满足后续分析要求。采用De novo预测、同源预测和基于转录本预测3种方法共注释到14 568个基因,其中92.4%的基因获得了功能注释。本研究首次完成了美洲大蠊的全基因组测序,也是大蠊属Periplaneta昆虫的第一个基因组,为美洲大蠊遗传进化分析和药用基因资源挖掘打下了重要基础。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号