排序方式: 共有146条查询结果,搜索用时 46 毫秒
71.
针对目前中文词语语义相似度方法中,基于信息内容的算法研究不足的问题,对知网信息模型上使用基于信息内容的中文词语相似度算法进行了研究。根据知网采用语义表达式表示知识而缺乏完整概念结构的特点,通过抽取知网语义表达式中的抽象概念,结合原知网义原树构建具有多重继承特征的知网义项网作为基于信息内容的计算本体。根据该义项网,对基于信息内容的词语相似度算法进行了改进,提出了新的信息内容含量计算方法。经过Miller&Charles(MC30)基准平台的测试,验证了基于信息内容方法在计算中文语义相似度方面的可行性,也证明了本文的计算策略和改进算法的合理性。 相似文献
72.
该文提出一种基于句法规则和HowNet词典的商品评论细粒度观点分析方法,主要包括三个模块: 评价对象抽取、评价对象—评价词对抽取、评价对象总体观点得分计算。具体思路为: 首先,结合词性标注和频繁项集方法构建一个初始的评价对象词典,便于重用和修正商品的总体评价维度;其次,基于爬取的电商评论文本真实数据设计了评价对象—评价词对抽取规则;最后,借助HowNet词典分别计算不同评价维度的观点综合得分,进而对比同一商品不同品牌在各个维度下的总体观点评价,该方法在商品评论语料集上验证了有效性。 相似文献
73.
74.
75.
传统的向量空间过滤模型通常是提取字、词、短语等作为特征项,这样做的缺点是没有考虑文本的语义信息。文章提出了利用知网对向量空间模型的文本向量进行同义词消除的过滤方法。该方法比传统的单纯基于关键词匹配的方法更精确地体现了文本之间的相似度,提高了过滤性能,同时也降低了向量空间的维数,减少了计算量,提高了过滤的效率,实验结果表明基于该文的过滤方法确实提高了系统的性能。 相似文献
76.
77.
提出一种基于知网的汉语普通未登录词语义分析模型,该模型以概念图为知识表示方法,以2005版知网为语义知识资源,首先参照知网知识词典对普通未登录词进行分词;然后综合利用知网中的知识词典等知识,通过词性序列匹配消歧法、概念图相容性判定消歧法、概念图相容度计算消歧法及语义相似度计算消歧法对中文信息结构进行消歧;最后根据所选择的中文信息结构生成未登录词的概念图,从而实现未登录词的语义分析。该模型在语义分析过程中一方面确定了未登录词中每个已登录词的词义,另一方面构造了该未登录词的语义信息,实验结果证明它可以作为普通未登录词语义分析的原型系统。 相似文献
78.
提出了一种基于知网的多关键词语义关系分析方法,并利用其得出核心关键词,设置分级权重,从而解决了搜索引擎在面对多关键词检索时只作机械性的字符串匹配的缺陷。实验结果表明,查准率有明显提高。 相似文献
79.
词汇语义褒贬倾向性研究是句子褒贬倾向性识别的基础,而句子褒贬倾向性识别又是文本倾向性识别和篇章结构褒贬倾向性识别的基础。以《知网》的词汇语义相似度计算为基础,针对目前采用计算基准词对与词汇相似度的方法识别词汇褒贬倾向性理论,从褒贬基准词和计算公式入手,提出了改进办法。实验证明,在同样基准词对下,准确率得到了很大的提高,达到98.94%,具有实际应用价值。 相似文献
80.
为了利用计算机协助人们建立待求解问题的可拓模型,必须让计算机识别用自然语言描述的问题,而且要理解问题的含义,这是相当困难的任务。本文提出利用人机界面Agent的智能引导并结合知网(HowNet)中的知识系统描述语言(KDML),增强计算机语义处理能力的方法。以求职问题为实践的结果说明了方法的有效性。由于KDML有较强的表示语义信息的作用,通过人机交互也能减轻计算机自然语言理解的困难。因此该方法能将自然语言描述的待求解问题的目标和条件进行分离和形式化,使计算机更有效地建立待求解问题的可拓模型。 相似文献