首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 218 毫秒
1.
结合本体论和统计方法的跨语言信息检索模型   总被引:1,自引:0,他引:1  
为了更有效地提高跨语言信息检索的性能,结合本体论和统计方法的特性,提出一种混合的跨语言信息检索模型.在该语言模型的结构上,提出一种本体描述框架,构造了一个形式化的语言本体知识表示,通过典型语料学习,融合了语法、语义、句法等多元信息,建立了源语言本体知识库.在跨语言信息检索的实际应用中,利用本体表示,获得初始的检索文档集,再基于源语言本体知识库,对全部候选文档重新排序,以提高TopN排列的精确度.利用NTCIR-3Workshop中的中英文跨语言信息检索数据集对该语言模型进行了评价,相关实验结果表明,该方法取得了较满意的实验效果.  相似文献   

2.
目的为了有效地预测用户在信息检索过程中可能点击的检索结果,从而进行网页的智能推荐.方法采取网络日志挖掘的技术,通过词频信息和知网(HowNet)中词的概念计算模型计算网页文档间的主题相关度,再将该语义信息与统计模型计算的条件概率值相结合,以此作为网页推荐的依据.结果提出了一种检索推荐统计模型,并构建了相应的原型系统,实验表明该方法显著提高了推荐系统的准确率.结论这项技术有效地提高了推荐结果与用户信息需求的相关程度,使推荐系统的性能获得了较大地提高,可以很好的应用于信息检索的智能推荐服务领域.  相似文献   

3.
针对现有工程信息检索中文档语义理解和关联不足的问题,根据工程环境下信息检索的特点,提出一个异质工程文档的检索方法,包括内容分析、语义建模、多维关联、语义推理与扩展以及查询处理等过程.采用基于本体的理解标注多源异质工程文档,获取工程语义信息,建立语义标注库,实现异质文档内容的统一表达.采用以文档为中心的多维关联机制,在文档内容语义理解的基础上,将基于本体的内在关联扩展为融合文档及内容的多重关联.结果表明,多维关联机制能够启发式地关联产品生命周期中的文档,增强查询的导航能力,为语义推理和检索扩展提供服务.  相似文献   

4.
基于语义概念树和局部上下文分析的查询扩展   总被引:1,自引:0,他引:1  
针对信息检索中因文档与查询词之间的不匹配而影响信息检索效果的问题,提出了一种结合基于语义概念树和局部上下文分析的查询扩展模型。该模型对用户提交的查询关键词进行扩展,扩展词来源于基于语义概念树和局部上下文分析的扩展词。实验结果表明,与单纯采用局部上下文分析方法(LCA)相比,该方法有更优的检索性能。  相似文献   

5.
当前由于电子政务发展迅速而引起的电子政务文档数量剧增,如何使用户能够提高检索文档信息查准率的同时提高检索的查全率已经成为一个热门问题。文章提出电子政务文档元数据的语义组织方法,包括文档集的资源描述框架模型的建立、合并以及检索词在文档中相似度的计算。对电子政务文档的智能搜索提出一种基于语义网检索的实现方法,结合语义网便于机器理解的优点,提高了检索集的查全率和查准率。  相似文献   

6.
为了提高文本信息检索系统检索性能,针对信息检索系统中普遍使用的向量空间模型(VSM)所固有的缺陷,提出一种新的修正的向量空间模型(MVSM).该模型重新定义了查询索引项的内容,将修饰词与中心词组成的合成短语引入到查询语句及传统的向量空间检索模型的信息表示中,并重新计算作为特征索引项的合成短语的权重值.在此基础上,又对查询索引项使用了基于同义词词典的查询扩展策略.实验结果表明:用合成短语作为查询索引项进行检索,使检索能够在相对精确的范围内进行,提高检索查准率;对查询进行同义扩展,能够使更多的语义相关的文本被检索出来,提高检索查全率.因此,在信息检索系统中应用修正的向量空间模型能够较好地改善检索性能.  相似文献   

7.
传统的基于关键词的信息检索不能理解用户的需要,仅仅对关键词进行简单的匹配,其结果往往包含大量与用户实际需要毫不相干的信息,同时却丢失用户实际需要的信息,使得检索的效率很低.基于本体的语义检索技术的出现,弥补了基于关键词检索的不足,成为目前构建信息检索系统的应用热点.本文主要针对燃气管网的材料腐蚀信息,设计一个基于GIS(Geography Information System)的管网材料腐蚀信息语义检索系统,使用户检索管网空间数据和腐蚀数据时为其提供相关数据的语义信息,同时也使得检索结果更加符合用户需求.  相似文献   

8.
基于本体的个性化信息检索技术研究   总被引:1,自引:0,他引:1  
不同用户由于知识背景不同,兴趣爱好不同,信息需求不同,他们访问的往往都只是Web上某一个特定的资源子集,是关于某一特定领域的.而目前一方面大多数的检索系统采用关键词输入方式进行检索,对所有的用户都是千篇一律的界面、检索方式和检索结果.另一方面用户无法准确地表述自己对特定领域内信息的兴趣和需求,从这些现有信息检索模型存在的问题入手引入了本体的概念并建立了一种基于本体表示的用户兴趣模型.  相似文献   

9.
传统的信息检索方法一般都采用对文本内容的词频进行分析的统计方法,这种索引方法仅仅考虑词语在文本中的出现率,因此不能抽取出表达文本语义的索引词。为了解决这个问题,本文提出了一种新的信息检索方法,即基于概念的权重索引方法。本方法引入了概念类的概念,并且提出了用概念之间存在的关系来表示文档中的词汇和概念的语义重要度。本方法比单纯的词汇信息更能体现文本的概念特征,提高信息检索的性能;同时还能降低文本向量的维数,减少计算量,提高检索效率。  相似文献   

10.
三维模型检索是多媒体信息检索领域的重要组成部分,由于"语义鸿沟"的存在使得当前基于内容的检索结果通常不十分令人满意。考虑到解决"语义鸿沟"的关键是将三维模型的底层形状特征与高层语义特征进行有效融合,为此提出一种三维模型的语义与形状异构特征融合方法,该方法将三维模型在基于内容的检索过程中用户反馈信息形成的语义关联作为模型的语义表达,并通过子空间学习方法将这种语义表达信息与模型的底层特征进行融合,最后将融合后的新特征应用于三维模型检索中。在Princeton shape benchmark上的测试表明,该方法的检索结果明显好于单纯形状特征的检索结果。  相似文献   

11.
结构化文档由标题、章节、段落等逻辑结构组成。利用文本文档中自然层次结构的优点,提出了一种新的相似度查找方法,用问题回答系统来实现。主要任务就是从底层的结构化文档集合中找到用户需要的最合适的答案。这种方法可以提供多粒度的文档内容的检索,包括从单词、短语到段落或者章节。用微软百科全书Encarta作为测试集,实验结果表明本文的方法能获得更加准确、简短的答案,同时提供更多关于问题的上下文信息,从而更好地理解答案。  相似文献   

12.
将全信息(自然语言的语法、语义和语用信息)自然语言理解应用到可靠语音功能的研究中,提出在语音识别之后增加一个全信息自然语言理解的文本后处理功能,通过深入分析词语的语法信息(位置、识别稳定度)、语义信息(语句目标含义)和语用信息(语境和谐度)对语音识别结果语句进行评估、检错和纠错,最终输出优化语句。实验结果表明,增加全信息自然语言理解后处理可使识别正确率获得较好改善。  相似文献   

13.
将全信息(自然语言的语法、语义和语用信息)自然语言理解应用到可靠语音功能的研究中,提出在语音识别之后增加一个全信息自然语言理解的文本后处理功能,通过深入分析词语的语法信息(位置、识别稳定度)、语义信息(语句目标含义)和语用信息(语境和谐度)对语音识别结果语句进行评估、检错和纠错,最终输出优化语句。实验结果表明,增加全信息自然语言理解后处理可使识别正确率获得较好改善。  相似文献   

14.
基于关键词的传统信息检索技术缺乏语义理解能力,无法满足用户的需要。简要地介绍实现语义检索涉及到的相关概念包括资源描述框架,语义网技术和本体。本文对语义检索所涉及的关键技术进行了深入的分析研究,提出了一种基于本体的语义检索的方法,以人力资源领域本体为例,设计并实现了基于Ontology的人力资源语义检索系统。  相似文献   

15.
目标情感分析旨在分析评论文本中不同目标所对应的情感倾向。当前,基于图神经网络的方法使用依存句法树来融入依存句法关系,一方面,此类方法大多忽略了依存关系缺乏区分度的事实;另一方面,未考虑依存句法树提供的依存关系存在目标与情感词关系缺失的问题。为此,提出双重图注意力网络模型。该模型首先使用双向长短期记忆网络得到具有语义信息的词节点表示,然后根据依存句法树在词节点表示上构建句法图注意力网络,实现依存句法关系重要程度的区分,更有效地建立目标与情感词之间的关系,进而得到更准确的目标情感特征表示;同时根据句子的无向完全图构建全局图注意力网络来挖掘目标与情感词缺失的关系,进一步提升模型的性能。实验结果表明,与现有模型对比,双重图注意力网络模型在不同数据集上的准确率与宏平均F1值均取得了更好结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号