首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 125 毫秒
1.
句子相似度计算是自然语言处理的重要研究内容。运用自然语言处理的概念层次网络(HNC)理论和依存句法理论提出一种句子相似度的计算方法。该方法认为句子的相似度是由词语的语义相似度和句法结构相似度共同决定的,利用HNC理论词汇层面联想的概念表述体系来计算词语之间的相似度,利用依存句法理论来获取句子中词语的词语搭配和构成特征,与现有典型的句子相似度算法和人工判断进行了比较。实验结果表明,该方法能够较好地反应句子之间的语义差别,是一种可行有效的方法。  相似文献   

2.
基于HNC理论的语义相关度计算方法   总被引:8,自引:0,他引:8  
语义相关度计算对于语句的语义结构的分析有重要作用,同时也可以用于自动文本分类和信息检索的语义处理。该文以HNC理论的概念基元树表和词语的HNC符号映射方法为依据,提出并实现了语义相关度计算的方法。论文分析了这种方法的优势,并验证了它在语句语义结构分析中的作用。  相似文献   

3.
本体映射是解决本体异构的有效手段,而概念相似度计算是本体映射的关键环节。针对目前本体映射中概念相似度计算存在的问题,提出一种改进的多策略的概念相似度计算方法。首先根据两个概念的名称相似度进行初始映射判断,然后基于概念的属性、结构、实例计算概念相似度,并选取适当的权值进行加权综合。最后采用OAEI提供的标准数据测试集benchmark进行实验。实验结果表明,该方法在保证映射效率和通用性的同时,提高了映射结果的查全率和查准率。  相似文献   

4.
针对信息检索中查询与文档集之间可能存在的“词不匹配”问题,基于兴趣模型提出一种将概念化的兴趣知识与向量空间模型相结合的查询扩展方法。该方法能根据阈值来判断查询扩展是否可行。用户的兴趣偏好是通过Agent代理实时获取的,兴趣知识采用HNC(Hierarchical Network of Concepts, 概念层次网络)理论的概念符号体系表达,这样便于计算概念之间的相似度。实验结果表明,经过查询扩展后的结果相对于未加入查询扩展的结果在性能上提高了29.1%。  相似文献   

5.
使用概念基元特征进行自动文本分类   总被引:2,自引:0,他引:2  
自动文本分类技术是大规模文档数据处理的关键技术,在文本分类过程中通常先进行文本表示,即把文本转化为特征向量,这其中常用的特征有特征词、词频、N-gram等等。论文研究了一种新的特征,即词语的HNC概念符号。词语的HNC概念符号来自于HNC(概念层次网络,HierarchicalNetworkofConcepts)建立的语义网络,以符号表达式的方式表示了词语的语义信息。因此使用HNC概念符号作为特征实际上是以文本中蕴含的语义信息作为特征,和词频等使用文本表层信息的特征有本质的不同。采用最大熵模型的方法建立分类器,以分词和HNC概念符号作为特征进行了研究,并对分类结果进行了比较。结果表明,HNC特征优于分词特征。  相似文献   

6.
本体映射是实现异构本体间互操作的有效方法,其核心环节是概念相似度的计算。针对传统概念相似度计算方法中存在的不足之处,提出了一种综合的概念相似度计算方法——DISS模型。该算法从概念定义、概念实例、概念结构三个方面计算相似度。实验证明,该算法改善了传统计算方法中存在的片面性和不完善性问题,提高了本体映射的查全率和查准率。  相似文献   

7.
一种综合的本体相似度计算方法   总被引:6,自引:1,他引:5  
本体相似度计算是本体映射的关键环节.本体的实例、关系、属性、结构等信息是相似度计算需要考虑的重要因素.针对目前本体映射过程中相似度计算所存在的问题,提出了一种综合的相似度计算方法.首先判断不同本体之间是否存在相关性.若相关,则充分考虑各种相关因素,从语义和概念两个层面来进行比较,然后给出了本体的综合相似度计算方法.最后采用了两组测试数据对该方法进行实验,并与GLUE系统的概率统计方法进行了实验对比.实验结果表明,该方法能够有效确保相似度计算的准确性.  相似文献   

8.
词语语义相似度计算是计算机自然语言处理中的关键问题,而相似度计算仅考虑单一的距离因素显然不够合理。通过分析概念网深度和密度因素对相似度计算的影响,提出一种改进的多因素相似度计算方法。实验结果表明,该方法能够根据概念网中节点对的分布状态,调整各影响因素的分配比例,从而使相似度计算结果更趋于合理判断。  相似文献   

9.
针对目前本体映射过程中相似度计算存在的问题 ,提出了一种综合的相似度计算方法。首先判断不同本体之间是否存在相关性 ,若相关 ,则充分考虑各种相关因素 ,从语义和概念两个层面来进行比较 ;然后给出本体的综合相似度计算方法 ;最后采用两组测试数据对该方法进行实验 ,并与 GLUE系统的概率统计方法进行了实验对比。实验结果表明 ,该方法能够有效确保相似度计算的准确性。  相似文献   

10.
本体映射过程中概念相似度计算方法的改进   总被引:1,自引:0,他引:1       下载免费PDF全文
针对本体映射中概念相似度计算中存在的一些不足之处,提出了一种改进的方法。首先根据本体概念树的特点以及数据挖掘的思想,提出了一种改进的侯选映射集设置的方法,减少了相似度计算的工作量。进而根据本体和本体中概念的特点,综合概念名称、概念实例、概念的属性、结构、关系等因素。设计了一种改进的相似度的计算方法。改善了相似度计算中存在的片面性和不完善性问题,提高了本体映射的查全率和查准率。初步实验表明该算法在计算复杂度、查全率和查准率上都要优于Glue方法。  相似文献   

11.
语义块切分是HNC理论的重要课题,与以往的处理策略不同,采用统计建模的方法来解决这一问题。采用词语、词性、概念等信息组成特征模板,并应用增量方法进行特征选择,构建了一个基于最大熵模型的语义块切分系统。在HNC标注语料库上的测试取得了较好的效果,开放测试的正确率和召回率分别达到了83.78%和91.17%。  相似文献   

12.
王宇  王芳 《计算机应用研究》2020,37(6):1769-1773
社区问答系统中充斥着大量的噪声,给用户检索信息造成麻烦,以往的问句检索模型大多集中在词语层面。针对以上问题构建句子层面的问句检索模型。新模型基于概念层次网络(hierarchincal network of concept,HNC)理论当中的句类知识,从句子的语用、语法和语义三个层面计算问句间相似度。通过问句分类算法确定查询问句和候选问句的问句类别,得到问句间的语用相似度,利用句类表达式的结构和语义块组成分别计算问句间的语法及语义相似度。在真实数据集上的实验表明,基于HNC句类的新模型提高了问句检索结果的准确性。  相似文献   

13.
一种本体概念的语义相似度计算方法   总被引:1,自引:0,他引:1  
概念语义相似度已广泛应用于 Web 服务发现、本体映射等领域, 但现有的概念语义相似度计算方法对概念间语义相似程度的区分不够细致. 本文从本体结构出发, 首先提出了自底向上的本体概念出现概率计算方法, 并在此基础上改进了基于节点信息量的概念语义相似性度量方法; 然后又设计了基于边计算的本体概念语义相似度计算方法; 最后对上述两种方法线性加权, 提出了一种加权的本体概念语义相似度计算方法. 实验结果表明该方法能进一步正确区分本体中父子概念及兄弟概念间的相似程度.  相似文献   

14.
汉语词语语义相似度计算研究   总被引:12,自引:0,他引:12       下载免费PDF全文
夏天 《计算机工程》2007,33(6):191-194
汉语词语的语义相似度计算是中文信息处理中的一个关键问题。该文提出了一种基于知网、面向语义、可扩展的相似度计算新方法,该方法从信息论的角度出发,定义了知网义原间的相似度计算公式,通过对未登录词进行概念切分和语义自动生成,解决了未登录词无法参与语义计算的难题,实现了任意词语在语义层面上的相似度计算。针对同义词词林的实验结果表明,该方法的准确率比现有方法高出近15个百分点。  相似文献   

15.
领域本体的概念相似度计算   总被引:11,自引:1,他引:11  
随着本体在信息检索、人工智能等领域的广泛应用,面向本体的概念相似度计算成为了本体研究的一大热点。当前领域本体中概念相似度的研究主要是利用概念的上下位关系进行计算,但这并没有完整反映出概念的语义信息。论文提出的算法将概念相似度计算分为两层,一层是概念语义初始相似度层,其主要利用概念之间的距离来计算概念的初始相似度。另一层是概念非上下位关系相似度层,其在概念初始相似度的基础上,计算概念通过非上下位关系体现出的相似度。最后通过综合计算,得到领域本体中概念的实际相似度。实验证明,该方法充分利用了本体中概念的语义信息,得到的结果也比较合理。  相似文献   

16.
提出一种新型Overlay网络服务发现机制,该机制充分利用概念之间的语义相似性,从语义概念树模型扩展概念相似度的计算,并将该语义概念树模型应用到Overlay网络服务发现机制的研究中。实验证明,该语义概念模型能够根据用户的想法和查询词条的内在含义进行相近语义短语的查找,实现匹配机制的语义化,提高了服务发现的查准率。  相似文献   

17.
韩仙玉  姜瑛 《计算机应用》2011,31(6):1487-1490
为了提高构件测试信息的检索效率,针对现有本体语义相似度计算方法作用于构件测试本体时容易出现漏检的问题,提出一种结合本体概念和属性的综合语义相似度计算方法。该方法首先结合概念的结构、层次、子代节点个数和祖先节点个数等因素计算概念相似度;然后,结合属性的概念相似度和数据类型相似度计算属性相似度;最后,综合概念相似度和属性相似度计算本体的语义相似度。实验表明该方法可以有效应用于构件测试领域及其他领域的信息检索。  相似文献   

18.
一种改进的概念语义相似度计算方法   总被引:1,自引:0,他引:1       下载免费PDF全文
针对当前概念相似度计算的片面性和不完善性等不足,提出一种改进的基于语义距离的概念间语义相似度计算方法。从有向边包含的信息量、有向边的类型以及概念密度3个方面对语义距离进行扩展,将语义距离转换成语义相似度,通过引入不对称因子,使最终概念语义相似度计算更加精确。将该方法与基于信息量方法、基于距离方法及人的主观判断结果进行比较,验证了该方法的可行性和有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号