首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
袁芳  李靖 《计算机应用研究》2012,29(11):4213-4215
如何从连锁定位区域中的众多基因中有效选取疾病候选基因是疾病诊断治疗和预防的基础。基于基因功能注释信息,设计和实现了一种新的基于基因功能相似性的疾病基因预测工具DGP,分析候选基因和已知疾病基因的GO之间的相似性,对候选疾病基因进行打分排序。从OMIM数据库中提取一个包含1 045个已知疾病基因、涉及305种疾病的数据集来测试DGP的性能,其中56.7%的疾病基因在候选基因中排名前5%,68.5%的疾病基因位于前10%,结果显示DGP具有很高的准确率,能够从某个染色体区间中有效地识别出疾病基因。  相似文献   

2.
陈光  郑影 《福建电脑》2003,(12):17-18
随着生物信息学数据的大量积累,通过对核酸序列或蛋白质序列进行比对,可以有效地分析和预测一些新发现基因的功能。序列比对的理论基础是进化学说,如果两个序列之间具有足够的相似性,可以推测二者有共同的进化祖先;二个具有同源性的生物,其序列具有一定的相似性。如果一个新测定的DNA序列与一已知的基因序列很相似,那么,该基因序列含有与已知基因序列相似的结构和功能。因此,序列比对方法的应用对于基因结构和功能的研究具有较大的实际意义。双序列比对是序列分析的常用方法之一,是多序列比对和数据库搜索的基础。传统的双序列比对算法时间和空间复杂度均为O(m*n)。我们在介绍传统的动态规划算法后,将就时间和空间方面提出建议,并加以具体描述。  相似文献   

3.
基于二分频率变换的序列相似性查询处理技术   总被引:1,自引:0,他引:1  
作为基因功能预测的主要手段,序列相似性查询技术是生物信息学领域的研究热点.基因序列和结构的相似性往往决定了基因功能的相似性,因此可以通过基因序列的相似性查找来预测新基因的功能.分析了MRS索引中频率变化和小波变换等相关技术,讨论了它们的缺点和不足,提出了一种基于二分频率变换2-PFT的序列似性查询处理技术.首先,设计了二分频率变换和相应的距离函数,使得系统较之频率变换和小波变换具有更高的过滤能力,极大地提高了系统的性能;其次,解决了处理任意长度查询的问题.理论证明和实验结果均表明,2-PFT系统的性能远远优于MRS系统.  相似文献   

4.
高通量生物实验技术的发展提供了大量的生物分子网络和表达谱信息,基因的功能表现都和这些生物信息息息相关,而很多基因的功能信息仍然十分缺乏的,利用生物实验检测基因功能费时费力,从而产生了很多基于生物信息学的基因功能预测方法。这些方法使用统计分析,图论和机器学习等领域的算法对这些生物信息进行充分利用,算法的优劣和所使用生物信息的可信度与类型决定了基因功能预测的准确率。本文阐述了基于不同算法和生物信息的基因功能预测方法,尤其重点论述了近几年发表的多组学数据融合的基因功能预测方法,对这些方法按类型归纳,分析这些方法在预测方面的优缺点。  相似文献   

5.
现有疾病基因预测方法大多利用致病基因的各类注释信息进行预测,但仍有很多疾病没有任何注释信息。针对该问题,提出一种基于文本挖掘与功能相似性的疾病基因预测方法,通过数据挖掘获取疾病的相关基因本体术语,利用功能相似性分析基因与疾病之间的相关程度,并根据该相关程度对所有候选基因进行排序,从而识别出致病基因。测试结果显示,该方法能有效预测没有已知功能注释的致病基因。  相似文献   

6.
生物序列比对是生物信息学中最基础的研究课题之一.基于动态规划的Needleman-Wunsch双序列比对算法主要采用迭代算法及空位罚分规则对基因序列进行逐一比对,计算二者相似性得分,最后通过回溯分析得出序列之间的最佳比对.虽然该算法可以得到最佳比对结果,但是时间复杂度和空间复杂度较高.首先对原算法进行分析,对计算得分和...  相似文献   

7.
随着高通量生物实验技术的快速发展,特别是基因芯片和新一代测序技术的发展,全基因组范围内的基因表达数据呈爆炸式增长。利用网络生物学的方法对高通量基因表达数据进行分析和挖掘已经成为生物信息学重要的研究方向。对基因共表达网络的研究与分析从系统层面上加深了研究人员对生物系统的认识。本文综述了基因共表达网络的构建和分析的常用方法,主要包括基因相似性度量方法、阈值选择方法、拓扑分析方法、基因模块识别及其功能注释方法,并对一些常用的分析工具进行了分析总结。  相似文献   

8.
为有效表示文本结构信息,提高文本分类性能,提出一种增强加权共现图的文本分类方法。利用加权共现图表征文本,基于术语与文本分类的相关性对术语及其相依性进行加权;通过词相似性矩阵对加权图进行增强,增强图的节点和边。采用基于边匹配的图核,计算文本之间的相似性。实验在3个公开数据集上进行,在标准设置情况下,相比于其它优秀方法,所提方法在精度、召回率和F1得分提高约5%。在少量标注样本情况下,所提方法Micro-F1的增益在3%到8%之间。  相似文献   

9.
侯泳旭  段磊  李岭  卢莉  唐常杰 《软件学报》2018,29(3):721-733
人类基因组计划的成果推动生物信息学研究的发展.基于疾病表型相似性策略寻找功能上存在联系的致病基因,称作"表型相似基因",具有重要的研究价值和广阔的应用前景,成为一个新兴的研究热点.然而,生物医学领域尚没有利用计算机方法开展基于"基因-疾病-表型"关系网络的表型相似基因搜索研究.对此,利用疾病公开数据库构建了包含基因、疾病、表型这三类异构类型节点的疾病信息网络,并设计了基于疾病信息网络的相似基因搜索算法gSim-Miner.针对疾病表型数据的特点,设计了剪枝策略提高算法效率.通过在真实数据上的实验,验证了疾病信息网络对搜索表型相似基因的适用性,以及gSim-Miner算法的有效性,执行效率和可扩展性.  相似文献   

10.
随着大数据时代的来临,microRNA与基因的序列数据不断增加,如何从大量的数据中挖掘有生物学意义的信息成为新的热点问题。研究表明microRNA间以协作的方式在疾病中发挥作用,并呈现出网络的结构化趋势。因此,系统分析不同microRNA间的相似性将在疾病生物学标记挖掘等研究领域起到关键的桥梁作用。而microRNA通过调节其靶基因发挥作用,所以本研究将充分利用现有靶基因数据,从功能角度分析microRNA间的相似性。研究选取前期工作所得的靶基因优化列表,利用富集分析将基因集合转化为功能节点集合,并在此基础上利用集合相似性测度计算microRNA对在不同层面的功能一致性。结果表明,相同家族的microRNA倾向于调控相同或相似的靶基因;类比于非靶基因,microRNA靶基因倾向于共享较多相似的细胞组分,而在生物学通路及生物学过程中则具有相对较低的相似性。  相似文献   

11.
对DNA芯片测序所得到的匹配探针,设计算法进行拼接。采用堆栈的结构很好地处理了拼接过程中出现的分支问题,根据靶基因的长度范围和探针长度等数据提出了一系列较完整的拼接正确性判定方法,讨论了假阳性和假阴性的影响及处理方法。该算法能很好地根据DNA芯片杂交出的匹配探针拼接还原出DNA靶序列。  相似文献   

12.
基因表达式编程算法的应用   总被引:1,自引:0,他引:1  
讨论基因表达式编程算法的设计原理。对基因表达式编程进行了详细的介绍,将GEP运用于函数关系发现问题,仿真结果表明,该算法收敛速度较快,预测精度很高。  相似文献   

13.
基因调控过程中的典型控制环节   总被引:2,自引:0,他引:2  
卢欣  李衍达 《自动化学报》2000,26(5):637-644
生物系统的控制和机械系统的控制一样,都遵循控制论的基本原理.生物学家对于基 因调控和细胞信号传导过程已经进行了许多实验研究,急需对实验结果进行理论总结.综述了 这些研究成果,归纳出7种典型的控制环节.基因调控和信号传导路径可以由这些控制环节组合 而成,可以用控制论进行分析研究,寻找其中的共同规律.  相似文献   

14.
基因表达分析中的微阵列数据具有高维、高冗余的特点,给基因表达数据分类带来很大的困难。机器学习中的最小二乘支持向量机算法具有计算效率高的优势,从而为数据挖掘提供了一条有效途径。针对两类典型的癌症微阵列数据集(结肠癌集和白血病集),进行归一化预处理并且计算其相关系数矩阵;使用主成分分析法进行降维处理,得到用于特征选取和分类的信息基因集(各取10个基因);采用最小二乘支持向量机分类器对信息基因集进行分类。实验结果表明,该算法在两类癌症数据集上的留一交叉检验的准确率分别为97.5%和100%,具有比其他分类器都高的测试准确率,为进一步医学临床应用提供可靠的诊断依据。  相似文献   

15.
借鉴生物免疫系统的克隆选择机制,利用生物工程中基因重组技术,提出一种基于基因重组的克隆选择算法。根据抗体亲和力大小对抗体进行选择,获取优秀抗体的优秀基因片段,对抗体进行不同程度的基因重组,实现高频变异过程中的定向控制,避免种群退化,加快收敛速度,提高全局搜索范围,防止局部收敛。通过对复杂函数优化问题的仿真实验表明,基于基因重组的克隆选择算法(GRCSA)具有良好的收敛速度和较高的问题解的精度,证明新算法的有效性。  相似文献   

16.
基因表达式编程算法及其应用综述   总被引:1,自引:0,他引:1  
基因表达式编程GEP(Gene Expression Programming)是一种基于生物基因结构和功能发明的一种新型自适应演化算法.阐述算法的基本原理、技术特点,并对算法的性能进行了分析;同时介绍了算法的主要应用领域及国内外研究现状;最后探讨了GEP的研究方向.  相似文献   

17.
为了能找出与疾病相关的诊断基因,更好地进行基因诊断和基因治疗,利用支持矢量机(Support Vector Machines,SVM)给出了一种针对多病类情况的基于SVM和相关性的基因选择方法.该方法一次性考虑基因区分所有病类的能力,为避免所选基因冗余,对所选基因的相关性加以约束,然后进行基因选择.采用该方法对真实的DNA微阵列数据进行实验,样本在所选基因子空间上的表达数据有很好可分性,所选基因子空间有良好的分类推广能力,表明了该方法的有效性.  相似文献   

18.
为了从高维、小样本的基因表达数据中有效地选择特征基因,消除与肿瘤分类无关的数据,提出一种随机矩阵替换与支持向量机的肿瘤信息基因选择算法(RD-SVM)。首先构建多组0/1随机向量表示的信息基因子集,并以支持向量机构建分类器评价每组子集的优劣,然后考虑各特征之间的相互作用,以0、1替换策略对基因子集评估,并找到最优基因子集,最后采用5个肿瘤信息基因表达谱数据对算法性能进行测试。结果表明,相对于参比算法,RD-SVM算法不仅提高了肿瘤信息基因的识别精度,同时所选信息基因最少。  相似文献   

19.
设计求解TSP问题的贪心基因库并行演化算法.该算法基于改进的反序交叉并行TSP演化算法,对主进程和子进程进行适当修改,引入了贪心基因库算子,将基因库中的基因片,替换演化群体中个体的基因片.实验结果表明,算法能取得更好的解.  相似文献   

20.
二代测序NGS(Next-generation sequencing)数据的迅速发展加快人们对于基因的探索,同时也给测序数据分析任务带来更大的挑战。癌细胞特异变异的识别是测序数据分析的一项重要基础性工作。当前的变异识别工具大多采用贝叶斯模型方法,特异度、灵敏度和速度都远远满足不了需求。K-means是一种简洁高效的无监督聚类算法,基于此将位点信息映射成多维的特征,再进行类别个数为2的聚类过程。该算法明显提高了准确度和召回率,实验结果验证了算法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号