首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 328 毫秒
1.
比较基因或基因产物功能上的相似性是生命科学研究的一项重要内容,它在生物大分子功能预测、基因聚类、生物网络分析和疾病相关基因筛选等方面具有广泛的应用。计算基因之间的功能相似性已经成为生物信息学研究的基础性工作。基因本体GO(Gene Ontology)体系集成了多种异质数据库的信息,用结构化的自然语言术语对基因和基因产物的功能进行注释和分类,是研究基因功能相似性的有力工具。从GO术语之间相似性、基因之间功能相似性两个方面,总结和评述过去十几年里,人类利用生物信息学方法在语义水平上研究基因功能相似性的进展和取得的成果,分析基因功能相似性计算方法存在的问题和面临的挑战,指出基于GO体系的基因功能相似性度量方法今后的主要研究方向。  相似文献   

2.
一种衡量基因语义相似度的新方法*   总被引:1,自引:1,他引:0  
利用GO (Gene Ontoloty) 来衡量基因之间的相似度是近年来研究的热点。传统的方法在准确性上有一定的弊端,本文提出了一种新的方法来衡量基因之间的语义相似度。该方法的主要原则是同时依赖于GO拓扑结构图中基因注释项之间的路径长度和基因注释项的公共祖先节点在GO拓扑结构图中的深度。本文用人工数据和取自酵母基因数据库的基因数据进行了实验,结果表明本文的方法比传统方法更有效。  相似文献   

3.
现有疾病基因预测方法大多利用致病基因的各类注释信息进行预测,但仍有很多疾病没有任何注释信息。针对该问题,提出一种基于文本挖掘与功能相似性的疾病基因预测方法,通过数据挖掘获取疾病的相关基因本体术语,利用功能相似性分析基因与疾病之间的相关程度,并根据该相关程度对所有候选基因进行排序,从而识别出致病基因。测试结果显示,该方法能有效预测没有已知功能注释的致病基因。  相似文献   

4.
该文在以基因本体论GO(Gene Ontology,GO)为例考察生物领域知识对基于机器学习的基因挖掘方法的影响。通过基因芯片表返谱数据实验,考察几种基因挖掘方法用与不用GO信息的效果,结果表明利用GO信息,基因挖掘方法都能得到改善。  相似文献   

5.
袁芳  李靖 《计算机应用研究》2012,29(11):4213-4215
如何从连锁定位区域中的众多基因中有效选取疾病候选基因是疾病诊断治疗和预防的基础。基于基因功能注释信息,设计和实现了一种新的基于基因功能相似性的疾病基因预测工具DGP,分析候选基因和已知疾病基因的GO之间的相似性,对候选疾病基因进行打分排序。从OMIM数据库中提取一个包含1 045个已知疾病基因、涉及305种疾病的数据集来测试DGP的性能,其中56.7%的疾病基因在候选基因中排名前5%,68.5%的疾病基因位于前10%,结果显示DGP具有很高的准确率,能够从某个染色体区间中有效地识别出疾病基因。  相似文献   

6.
针对数据库连接池基本参数配置中存在的盲目性,提出了一种基于负荷预测理论的连接池参数优化方法。通过采用搜索算法得到连接池历史参数,利用处理后的历史数据预测系统特性,对数据库连接池的参数配置进行了优化,最后通过试验验证了方法的有效性。  相似文献   

7.
目前关于本体复杂性的研究,还没有比较系统和全面的方法。从本体概念模型的结构特点出发,将其与复杂网络的结构进行类比,借鉴复杂网络研究的研究方法和性质参数对本体结构进行研究,并选取生物学领域应用较广的GO本体作为样本,对其平均路径长度、度分布和簇系数等参数进行统计和分析,结果表明其具有无标度特性而不具有小世界特性。  相似文献   

8.
本体采用基于语法词汇的表述方式,使本体自身表示可能存在模糊性、错误理解等问题,部分本体的概念可以通过自身的上下文信息推测出其含义,但是有些本体根据已有信息不能清晰表达其概念的确切含义.针对这个问题,提出基于背景知识的本体注释方法,对本体本身进行注释和澄清.包括基于WordNet和Web搜索引擎的注释方法,利用WordNet查找本体概念的正确词义,利用Web搜索引擎搜索本体概念的snippets,分别将词义和snippets作为其属性注释到本体中.实验表明本体注释率达到99.12%,表明本文方法的是可行的,本体注释正确率达到80.76%,比同类方法更高.  相似文献   

9.
在数据库内写入注释是建立数据档案和维护修改数据库的常用方法。本文提供的程序可快速、方便地在数据库内设置注释内容,并提供了在DBASEⅢPLUS下直接调用注释内容的程序和方法。  相似文献   

10.
针对独立基因预测算法可靠性较差的缺点,提出了真核生物多基因预测结果整合算法(Algorithm for integration of multiple eukaryotie gene prediction results,AIMEGPR).该算法在综合分析各种预测算法结果的基础上,首先用极大似然法估计各种预测算法的性能参数,然后利用这些性能参数计算基因证据区间上各个基因片段归属于各种基因元件类型的后验概率,最后采用动态规划法在基因证据区间上确定最优的一致基因结构.AIMEGPR既不需要人工定制整合规则,也不需要复杂的训练学习,因此AIMEGPR尤其在基因组新测序物种上进行编码基因注释时具有十分显著的优越性.实验结果表明,利用AIMEGPR算法对多基因预测结果整合可以明显提高一致基因的可靠性.  相似文献   

11.
While most ontologies have been used only by the groups who created them and for their initially defined purposes, the Gene Ontology (GO), an evolving structured controlled vocabulary of nearly 16,000 terms in the domain of biological functionality, has been widely used for annotation of biological-database entries and in biomedical research. As a set of learned lessons offered to other ontology developers, we list and briefly discuss the characteristics of GO that we believe are most responsible for its success: community involvement; clear goals; limited scope; simple, intuitive structure; continuous evolution; active curation; and early use.  相似文献   

12.
For a well‐established digital library (e.g., PubMed), searching in terms of a newly established ontology (e.g., Gene Ontology (GO)) is an extremely difficult task. Making such a digital library adaptive to any new ontology or to reorganize knowledge automatically is our main objective. The decomposition of the knowledge base into classes is a first step toward our main objective. In this paper, we will demonstrate an automated linking scheme for PubMed citations with GO terms using an improved version of extreme learning machine (ELM) type algorithms. ELM is an emergent technology, which has shown excellent performance in large data classification problems, with fast learning speeds.  相似文献   

13.
张玉芳  徐安龙 《计算机应用》2012,32(5):1329-1331
目前,基于混合方法的相似度计算对影响语义相似度的因素分析不全面。针对这个问题,提出了基于多个影响术语语义相似度度量因素的综合方法。该方法结合语义层次,语义距离和局部语义密度,充分运用本体的语义信息来计算基因术语间的语义相似度。实验结果表明,该方法与人工打分的相关系数更高。  相似文献   

14.
15.
基于本体的概念语义相似度近年来在信息科学的多个领域获得了广泛的应用,其计算方法也为诸多学者所关注。分析现有基于本体的概念语义相似度计算方法的工作原理和优缺点,提出一种对概念共享路径的重合度和概念最低共同祖先节点的深度进行综合加权的概念语义相似度算法。该算法灵活简便、可扩展性强,能够应用于不同类型的本体。使用基因本体和植物本体的部分数据进行了实验并与两种现有算法进行了比较,实验结果证明了提出的计算方法的正确性和有效性。  相似文献   

16.
The application of various clustering techniques for large-scale gene-expression measurement experiments is a well-established method in bioinformatics. Clustering is also usually accompanied by functional characterization of gene sets by assessing statistical enrichments of structured vocabularies, such as the gene ontology (GO) [Gene Ontology Consortium. The gene ontology (GO) project in 2006. Nucleic Acids Research (Database issue), vol. 34; 2006. p. D322–6]. If different clusters are generated for correlated experiments, a machine learning step termed cluster meta-analysis may be performed, in order to discover relations among the components of such sets. Several approaches have been proposed: in particular, kernel methods may be used to exploit the graphical structure of typical ontologies such as GO. Following up the formulation of such approach [Merico D, Zoppis I, Antoniotti M, Mauri G. Evaluating graph kernel methods for relation discovery in GO-annotated clusters. In: KES-2007/WIRN-2007, Part IV, Lecture notes in artificial intelligence, vol. 4694. Berlin: Springer; 2007. p. 892–900; Zoppis I, Merico D, Antoniotti M, Mishra B, Mauri G. Discovering relations among GO-annotated clusters by graph kernel methods. In: Proceedings of the 2007 international symposium on bioinformatics research and applications. Lecture notes in computer science, vol. 4463. Berlin: Springer; 2007], in this paper we discuss, from an information-theoretic point of view, further results about its applicability and its performance.  相似文献   

17.
罗军  高琦  王翊 《计算机工程》2010,36(23):85-87
实现语义Web目标的一个重要前提是利用本体词汇标注Web资源。为此,提出一种基于弱监督(Bootstrapping)的本体标注方法。对给定的本体进行解析,生成规则文件,通过文本分类筛选出领域文档。采用Bootstrapping的方法进行信息标注抽取和本体推理,经过几次循环后,只利用少量的训练文本就能达到较好的标注效果。实验证明,该方法实体识别准确率高,标注效果好。  相似文献   

18.
基于领域本体的语义标注方法研究   总被引:3,自引:0,他引:3  
介绍了语义Web.本体以及语义标注的基本概念,对语义标注方法以及现有技术工具进行了简单地说明和分析,提出了一种基于领域本体的语义标注方法,并结合石油产品领域的本体对该方法进行了实例说明.该方法通过分析文档的特征词汇,使用基于领域本体的空间向量模型方法建立词汇与本体概念之间的映射.采用这种方法对文档进行语义标注后,可以把文档隐含的语义信息显式的表现出来,这样数据库内部文档之间就具有了语义关联关系,为检索的智能推理提供基础.  相似文献   

19.
Some recent studies have shown that association rules can reveal the interactions between genes that might not have been revealed using traditional analysis methods like clustering. However, the existing studies consider only the association rules among individual genes. In this paper, we propose a new data mining method named MAGO for discovering the multilevel gene association rules from the gene microarray data and the concept hierarchy of Gene Ontology (GO). The proposed method can efficiently find out the relations between GO terms by analyzing the gene expressions with the hierarchy of GO. For example, with the biological process in GO, some rules like Process A (up) → Process B (up) cab be discovered, which indicates that the genes involved in Process B of GO are likely to be up-regulated whenever those involved in Process A are up-regulated. Moreover, we also propose a constrained mining method named CMAGO for discovering the multilevel gene expression rules with user-specified constraints. Through empirical evaluation, the proposed methods are shown to have excellent performance in discovering the hidden multilevel gene association rules.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号