首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 203 毫秒
1.
基于领域本体的软构件检索   总被引:3,自引:1,他引:2  
为了提高刻面分类检索软构件的查准率,结合领域本体,提出了支持自然语言检索的软构件检索过程模型.该模型抽象了领域知识,形成领域本体库,用于匹配用户检索使用的自然语言,提供领域内一致认可的检索术语.该术语然后与软构件描述库中的软构件描述术语进行匹配,进而从软构件库中检索软构件.软构件描述库采用了刻面分类方法.ATS软构件检索实验结果表明,较之于传统的刻面分类方法,该检索策略既提高了检索精度,又增强了检索的灵活性.  相似文献   

2.
面向领域特征聚类的构件组装优化方法   总被引:3,自引:1,他引:2       下载免费PDF全文
Internet环境的开放、动态和难控等特点,使网构软件的构件组装问题变得十分复杂。提出了一种面向领域特征聚类的构件组装优化方法。通过引入本体分类和相似度比较方法,设计了一种基于划分的聚类算法,以实现基于领域特征的精确的构件聚类。通过对构件和链路的多维QoS指标的换算,给出了应用动态规划方法求解面向领域特征簇的构件组装全局最优解的算法实现。算法分析和实验仿真表明了该方法的有效性和可行性。  相似文献   

3.
本体构造就是利用各种数据源以半自动方式新建或扩充改编已有本体以构建一个新本体。现有的本体构造方法大都以大量领域文本和背景语料库为基础抽取大量概念术语,然后从中选出领域概念构造出一个本体。Cluster-Merge算法首先对领域文档先用k-means聚类算法进行聚类,然后根据文档聚类的结果来构造本体,最后根据本体相似度进行本体合并得到最终的输出本体。通过实验可证明用Cluster-Merge算法得出的本体可以提高查全率、查准率。  相似文献   

4.
介绍了领域本体的概念,分析了构件自动化组装的阶段和方面,给出了一个基于领域本体的自动化构件组装原型系统(ontology based automated assembly system,OBAAS),介绍了系统整体框架,并对该系统的基于领域本体的构件分类引擎,构件检索匹配和构件接口匹配验证模块的实现思想进行了详细说明,给出了利用朴素贝叶斯分类方法在领域本体基础上对构件的分类的算法、基于领域本体的构件检索和匹配算法,以及部分数据结构的描述。  相似文献   

5.
王刚  钟国祥 《计算机科学》2010,37(9):222-224
为了改善文本聚类的质量,得到满意的聚类结果,针对文本聚类缺少涉及概念的内涵及概念间的联系,提出了一种基于本体相似度计算的文本聚类算法TCBO(Text Clustering Based on Ontology).该算法把文档用本体来刻画,以便描述概念的内涵及概念间的联系.设计和改进了文本相似度计算算法,应用本体的语义相似度来度量文档间相近程度,设计了具体的根据相似度进行文本聚类的算法.实验证明,该方法从聚类的准确性和聚类的关联度方面改善了聚类质量.  相似文献   

6.
自动化地获取网络资源中的领域本体可以缩短本体的构建周期,但自动化的本体扩充还是本体工程中的一个挑战,其难点主要在于如何抽取术语并在新术语和已有本体之间建立映射关系。为此,提出了一个基于启发式规则的本体自动化扩充方法。该方法从网络资源中抽取自然语言文本,结合自然语言处理技术进行文本预处理,采用优先匹配对象属性的方式挖掘领域知识术语,然后通过启发式规则匹配术语的方式进行本体扩充,最后进行一致性检测。采用上述方法实现了一个基于Web的本体扩充工具。以城市景观信息核心本体作为研究案例进行了实验,结果显示本方法在扩充实例时具有较高的查准率和查全率,表明其具有有效性和可行性。  相似文献   

7.
基于语义扩展的构件描述模型   总被引:1,自引:1,他引:0  
根据构件模型的研究现状,针对目前的构件描述模型缺乏语义描述的支持,在刻面分类模式的基础上,提出了基于语义扩展的构件描述模型,采用OWL本体语言对构件本体的知识框架做了描述,并将此构件模型应用于教学评估系统,构造出了基于语义的软件构件检索体系构架,实现了对领域构件进行语义查询的目的.通过实验证明,该模型提高了构件检索的查全率和查准率.  相似文献   

8.
基于多个领域本体的文本层次被定义聚类方法   总被引:2,自引:0,他引:2  
传统的聚类方法常常将文本中关键词的相似度作为聚类的依据,丢失了很多重要的语义信息,导致聚类结果不够准确且计算量大。提出了一种基于多个领域本体的文本层次聚类方法,利用多个领域本体将用关键词表示的文本特征向量表示为与之匹配的概念向量集,定义文本相似度的计算公式,设计并实现基于多个领域本体的文本凝聚聚类算法。实验结果表明,该方法从概念层次上表示和处理文本,降低了聚类对象空间的维度,减少了计算量,提高了文本聚类的精确度和聚类效率。  相似文献   

9.
根据构件检索技术的研究现状,结合领域本体,对现有的构件描述模型进行了改进,提出了基于语义的构件检索模型及相应的概念语义匹配算法。通过试验分析,此算法提高了构件的查全率和查准率。  相似文献   

10.
针对刻面描述的检索方法的不足,引入领域本体,提出领域本体和刻面描述相结合的构件检索模型,并对所提出的构件检索模型中的构件检索过程进行研究。分析语义推理过程,提出基于本体和刻面描述相结合的检索算法。最后,构建一个第三方物流信息化构件检索的系统对所提出的构件检索机制的检索效率进行验证分析。验证结果表明,领域本体与刻面描述相结合可以提高构件检索的查全率和查准率。  相似文献   

11.
本文提出知识网格环境下基于领域本体的智能检索模型,采用OWL DL语言对领域知识进行形式化描述,支持推理和深层语义检索."标注"和"查询优化"是检索的两个关键技术.通过规范的概念和概念间语义关系对文档片段进行标注,并针对"一词多义"问题提出"主题-概念"两阶段消歧算法."查询优化"过程中,基于OWL DL推理的优化算法实现查询概念的自动扩展,提高了查全率和查准率.基于以上方法,建立航天领域本体,利用网上数据库开放资源作为测试集进行评测.实验显示,与传统基于  相似文献   

12.
基于主题图的本体信息检索模型研究   总被引:1,自引:0,他引:1  
针对本体在定义领域概念时具有规范性、明确性和可共享性等特点,结合主题图对文档资源组织方式具有语义可导航性,提出了一种基于主题图的本体信息检索模型,并给出了模型的形式化定义。选择旅游领域作为研究对象,定义了旅游本体和旅游文档资源主题图,分析了在信息检索模型中利用本体来规范用户自然语言查询输入,识别用户检索意图和扩展查询语义方面的作用,并展示了主题图在语义导航和用户相关度排序方面的价值。最后通过实验表明基于主题图的本体信息检索模型较传统的检索系统有较好的性能。  相似文献   

13.
基于用户兴趣的查询扩展语义模型   总被引:1,自引:0,他引:1  
自然语言中词的同义现象和歧义现象一直是降低信息检索查全率和查准率的关键,在Web搜索引擎上显得更加突出。提出了一种基于用户兴趣的查询扩展语义模型,通过构建基于Yahoo的语义ontology知识库消除同义现象,设计客户端的用户兴趣挖掘模型消除歧义现象。实验结果显示该方法能有效提高Web信息检索的查全率与查准率。  相似文献   

14.
用户期望搜索引擎能提供基于语义的网页信息检索。基于本体、基于自然语言理解、基于文本统计分析的方法是实现中文网页语义检索的主要途径。分析了它们的实现方法、技术挑战和优、缺点;建议中文网页语义检索系统的开发应选择与普通用户联系紧密的应用领域,并以汉语词汇为索引单元,适量地采用中文信息处理技术。基于语义的中文网页检索应在以下方面加强研究:语义相关性评价方法、本体构建和实体抽取算法、基于语义的索引、大规模语义标注样本集开发等。  相似文献   

15.
以RDF结构为基础的数据网的发展中,高效数据检索成为关键问题之一。形式化查询语言(如SPARQL)因其语法的复杂性及查询本体的相关性阻碍其效用的发挥,迫切需要新的方法或工具实现以自然语言为基础(如关键字检索)的检索。形式化查询语言是检索这类结构化数据的有效方式,用户习惯自然语言为基础的检索方式。因而如何自动将关键词为基础的检索方式转换成以形式化查询为基础的检索方式是实现数据网的重要一环。关联数据的自然语言查询方法自动将自然语言查询转换成SPARQL查询,提高系统的有效性和效率。文中在抽象转换度量模型的基础上,以本体为基础构建查询语义图及实现语义消歧,构建SPARQL查询。实验结果表明,该方法具有更高的召回率、精度及更低的时间消耗。  相似文献   

16.
研究了本体描述语言OWL,提出并实现了一个基于本体和Lucene的语义检索模型,利用领域本体知识库对用户的查询要求进行语义扩展,构建了具有全文检索和语义检索功能的语义博客系统。实验证明语义检索方案在运行效能上可行,并且可以提供更高的查准率和查全率,对改进当前的检索系统是具有一定积极意义的。  相似文献   

17.
利用领域本体概念关系实现语义检索,当没有可用的本体知识时,按传统关键词匹配完成检索.这种基于领域本体的混合信息检索模型融合关键词检索和语义检索的优势,弥补各自的不足,以改善检索性能.将其应用于计算机网络领域,将基于领域本体的混合信息检索模型与传统的关键词检索模型进行对比实验,结果表明混合模型的平均查准率得到了提高,验证...  相似文献   

18.

Text document clustering is used to separate a collection of documents into several clusters by allowing the documents in a cluster to be substantially similar. The documents in one cluster are distinct from documents in other clusters. The high-dimensional sparse document term matrix reduces the clustering process efficiency. This study proposes a new way of clustering documents using domain ontology and WordNet ontology. The main objective of this work is to increase cluster output quality. This work aims to investigate and examine the method of selecting feature dimensions to minimize the features of the document name matrix. The sports documents are clustered using conventional K-Means with the dimension reduction features selection process and density-based clustering. A novel approach named ontology-based document clustering is proposed for grouping the text documents. Three critical steps were used in order to develop this technique. The initial step for an ontology-based clustering approach starts with data pre-processing, and the characteristics of the DR method are reduced with the Info-Gain collection. The documents are clustered using two clustering methods: K-Means and Density-Based clustering with DR Feature Selection Process. These methods validate the findings of ontology-based clustering, and this study compared them using the measurement metrics. The second step of this study examines the sports field ontology development and describes the principles and relationship of the terms using sports-related documents. The semantic web rational process is used to test the ontology for validation purposes. An algorithm for the synonym retrieval of the sports domain ontology terms has been proposed and implemented. The retrieved terms from the documents and sport ontology concepts are mapped to the retrieved synonym set words from the WorldNet ontology. The suggested technique is based on synonyms of mapped concepts. The proposed ontology approach employs the reduced feature set in order to clustering the text documents. The results are compared with two traditional approaches on two datasets. The proposed ontology-based clustering approach is found to be effective in clustering the documents with high precision, recall, and accuracy. In addition, this study also compared the different RDF serialization formats for sports ontology.

  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号