首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 328 毫秒
1.
本文探讨了如何利用领域文本集来自动构建领域本体的技术,以辅助知识工程师方便快捷地构建领域本体.文中提出一种利用概念之间的语义相似度,通过蚁群聚类算法对概念集进行聚类,最后利用知网的义原层次结构抽取分类关系的算法,通过非对称簇分析函数评价概念间的关联度,以提取非分类关系,最终生成领域本体.实验证明了该本体学习系统的有效性.  相似文献   

2.
基于Web数据的本体概念抽取   总被引:1,自引:0,他引:1  
本体论(Ontology)在知识管理及语义网(Semantic Web)中越来越重要,但建造本体往往需要耗费大量的时间,且建造完成后本体的维护对知识管理者来说也是费时的工作。自动创建领域Ontology可以克服手工方法的不足,成为当前的研究热点之一;而概念是本体中最重要的组成部分之一,从半结构化的Web文档中自动抽取概念的效率和准确度的高低,直接决定了自动建造的本体的质量,提出一种自动的本体概念抽取模型,此模型不依赖于领域词典或核心本体,并且能达到快速有效地通过对中文Web文本挖掘自动地构建及更新领域本体概念的目的。  相似文献   

3.
马超 《计算机系统应用》2015,24(12):273-276
领域本体是对领域概念及其关系的一种高效合理的展现形式.在构建领域本体过程中,常常遇到的问题就是尽管本体概念完备但概念间关系复杂多样导致人工标记关系代价过高.使用无监督学习的关系抽取算法对包含丰富的领域概念的web信息进行抽取解决了这一问题.然而,传统的无监督学习的算法没有考虑到"单样例多概念对"的问题,导致最终抽取的概念关系不完整.本文利用交通领域的Web信息构建本体,将样例概念关系对权重引入传统的无监督学习方法Kmeans中,解决了此项问题并通过实验证明该算法取得了良好的效果.  相似文献   

4.
针对大多数本体构建工具只支持手工构建,造成本体构建效率极低、工作量大、容易出错、知识的动态及时更新和维护困难等问题,提出一种领域本体自动构建的框架系统,通过对企业已有数据库及相关领域中大量的知识进行本体学习,实现配置领域本体自动(或半自动)构建,给出不同数据源结构中的本体概念抽取、概念间语义关系抽取等关键技术。  相似文献   

5.
传统中文领域本体构建多采用手工构建的方法,这种方法费时费力且重用率不高。针对这种情况,提出一种把中文领域知识文档半自动化地转化为OWL(Web Ontology Language)本体的方法。该方法以武器装备领域为例,先使用分词工具ICTCLAS5.0对中文文档进行分词等预处理,然后使用TF-IDF算法、基于模板匹配算法挖掘领域核心概念、聚类概念等级关系,再使用Jena将聚类后的三元组文档形式化为OWL本体,最后使用Protégé工具对OWL本体进行可视化管理。实验结果表明,该方法可以有效地节省中文本体构建的时间和人力成本,为全面解决中文领域本体的自动化构建提供了一个新的思路和尝试。  相似文献   

6.
郑学伟 《微机发展》2014,(12):64-68
语义网的研究中基于领域本体的构建研究方法基本上还处于手工阶段,如何在本体的设计中实现自动构建仍然是目前需要解决的问题,而采用基于图的构建原理,应用MCL聚类的本体自动构建算法进行概念提取和关系运算。将领域文本文档映射为文档概念图,在关系运算中采用基于频繁信息子图的gSpan算法任意关系提取算法,得到基于OWL-DL描述的领域本体,并通过评价反馈机制进行闭环校正是研究的核心思想。  相似文献   

7.
对本体(ontology)的研究在计算机科学领域变的越来越广泛,但手工构建本体是一项繁琐而辛苦的任务,还容易导致知识获取瓶颈,无法保持本体的更新。本体学习技术是利用本体工程技术和机器学习技术等众多学科技术来实现本体的自动或半自动构建。该文提出了基于Web的本体学习模型,分析了模型实现中的文档预处理、术语抽取、概念选择、概念分类等关键技术。  相似文献   

8.
农业领域本体的构建将为农业垂直搜索引擎提供知识组织基础。在对本体构建技术进行深入研究的基础上,设计实现基于文献的农业领域本体构建方法。使用Web数据抽取技术获取农业文献,通过对文献分词和清洗,自动提取领域概念,并用关联分析和改进的层次聚类发现领域概念间关系,构建农业领域本体。通过实验验证,该方法提高了领域概念间关系聚类效果和领域本体构建效果。最后加以应用实施,实现了基于本体的农业垂直搜索引擎。  相似文献   

9.
从Web中提取中文本体非分类关系的方法   总被引:2,自引:0,他引:2  
为了有效地学习本体中的非分类关系以协助知识工程师构建领域本体,提出了一种在中文领域本体学习环境中自动获取概念之间非分类关系的方法,该方法以Web为数据源来提取候选关系并计算信息分布的统计特征,把动词作为发现非分类关系的中心点,把领域相关的动词作为种子来检索领域相关概念并用来标记相应的关系.该方法的学习结果是一个多级分类关系和非分类关系组成的语义体系.最后,通过对"癌"本体相应关系的提取及其性能分析,表明了该方法的学习结果和性能.  相似文献   

10.
基于非结构化数据的本体学习研究   总被引:4,自引:2,他引:2  
语义Web的创建需要一套共同的标准概念体系,即本体(Ontology)。而现在本体的构造手段仍然是以手工构造为主,效率和准确率都非常低,很容易导致知识获取的瓶颈。近年来,自动创建领域本体可以克服手工方法的不足,成为当前的研究热点之一;本体学习是自动或半自动构建本体的一系列方法和技术。提出了一种利用知网,基于非结构化数据的特定领域概念及其之间关系的提取算法,从军事领域选取4个种子概念:舰、导弹、机和炮,并通过实验测试了该算法。  相似文献   

11.
贾秀玲  文敦伟 《微机发展》2007,17(10):31-33
本体学习技术是利用本体工程技术和机器学习技术等众多学科技术来实现本体的自动半自动构建,可解决本体手工构建的不足。根据本体学习目前的研究现状,提出了一种从文本中半自动获取本体中分类关系的实现,讨论了本体学习中概念抽取和概念间分类关系抽取等关键技术。实现了本体中分类关系提取,对于非分类关系的提取还有待研究。  相似文献   

12.
针对电力监控系统面临的网络安全问题实际需求, 开展了本体自动构建技术研究, 以现有的领域本体自动化构建技术为基础, 从非结构化文本数据提取出电网安全监测领域本体SafeAgent, 采用机器学习、自然语言处理、关联规则等方法抽取本体概念, 挖掘概念之间的关系, 完善了领域本体自动化构建方案. 经实验验证, 本文采用的方法能以较高准确率完成领域本体的自动化构建工作, 克服对人工以及专家知识的依赖.  相似文献   

13.
针对目前矿山领域异构数据融合时先验知识获取困难、物联网本体库实时性差、实例对象数据手动标注方式效率较低等问题,提出了一种矿山语义物联网自动语义标注方法。给出了传感数据语义化处理框架:一方面,确定本体的专业领域和范畴,通过重用流注释本体(SAO)构建领域本体,作为驱动语义标注的基础;另一方面,使用机器学习方法对感知数据流进行特征提取与数据分析,从海量数据中挖掘出概念间的关系;通过数据挖掘知识来驱动本体的更新与完善,实现本体的动态更新、拓展与更精确的语义标注,增强机器的理解力。以矿井提升系统主轴故障为例阐述从本体到实例化的语义标注过程:结合领域专家知识及本体重用,采用"七步法"建立矿井提升系统主传动故障本体;为了加强实例数据属性描述的准确性,使用主成分分析法(PCA)与K-means聚类方法对数据集进行降维和分组,提取出数据属性与概念的关系;通过基于语义Web的规则语言(SWRL)标注具体先行条件与后续概念的关系,优化领域本体。实验结果表明:在本体实例化过程中,可利用机器学习技术从传感数据中自动提取概念,实现传感数据的自动语义标注。  相似文献   

14.
由于中文和英文在语法和句法等方面的差异,面向中文文本的本体学习方法尚存在一定困难。研究了面向中文文本的玉米病虫害本体学习方法。提出单字合并法,将其与TFIDF方法结合,进行概念抽取;将欧几里德距离与余弦距离加权平均计算概念相似度,进行概念关系抽取。从中国玉米网选取50篇领域文档,应用上述方法构建了玉米病虫害本体。  相似文献   

15.
针对目前本体的构建效率低、重用能力弱的问题,研究了一种新的本体模块化方法——基于森林转化为树的方法. 将待建模领域逐层分解为若干个不可再分的子领域,对各个子领域分别进行构建本体模块;最后根据概念间的继承关系和《数据结构》中森林转化为树的原理,把若干个本体模块组装成一个模块化本体. 在大学领域本体的构建上,对该方法进行了验证,结果证明,该方法可有效的提高本体的重用能力,可为构建大型领域本体提供一条有效途径.  相似文献   

16.
中文核心领域本体构建的一种改进方法   总被引:1,自引:0,他引:1  
核心本体对最基本的领域知识建模,并在上位本体和领域本体之间建立联系。上位本体是领域无关的而核心本体是领域相关的,因此在自动创建中文核心本体过程中,映射中文核心术语到上位本体概念有很多的错误。本文提出的改进方法首先找到共享后缀术语集内被共享的术语条数更多、与各术语的意义更接近的上位概念; 然后用其来改进词集中的核心术语和概念之间的映射。实验证明,该方法有效的提高了核心本体自动创建的精确度。  相似文献   

17.
智能搜索引擎是解决当前网络信息检索中存在诸多瓶颈问题的有效途径。智能搜索引擎需要获取、预处理、表示和集成不同层次的(如HTML/XML/RDF/OWL文档)的数据和信息,并最终转换成各领域的智能语义信息。领域本体是实行智能的关键。提出了一种实现从Web文档中(半)自动构建本体的学习系统框架,并讨论本体学习中概念的获取、相互关系的获取等关键问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号