共查询到18条相似文献,搜索用时 78 毫秒
1.
一种基于上下文的中文信息检索查询扩展 总被引:13,自引:5,他引:13
在中文信息检索的研究和实践中,由于查询中所使用的词可能与文件集中使用的词不匹配而导致一些相关的文件不能被成功地检索出来,这是影响检索效果的一个很关键的问题。查询扩展可以在一定程度上解决这种词的不匹配现象,然而,实验表明,通常简单的查询扩展并不能稳定地提高中文信息检索的检索效果。本论文中提出并实现了一种基于上下文的查询扩展方法,可以根据查询的上下文对扩展词进行选择,是一种相对“智能”的查询扩展方法。在TREC - 9 中文信息检索测试集上进行的实验表明,相对于通常简单的查询扩展,基于上下文的查询扩展方法取得了具有统计意义提高的检索效果。 相似文献
2.
邹琼 《计算机光盘软件与应用》2014,(8):98-98
查询扩展技术是提高信息检索查准率和查全率的有效手段。文章介绍了几种重要的查询扩展技术的工作原理,并对他们的算法效率进行了分析和比较。 相似文献
3.
查询词语和文档中词语的不匹配是影响文本信息检索效果的一个关键因素.查询扩展技术可以在一定程度上解决这种词的不匹配问题,然而,实验表明,通常简单的查询扩展并不能稳定地提高中文信息检索的检索精度.利用自动构建的相关术语群来进行查询扩展以提高中文检索的效果.在NTCIR中文信息检索测试集上进行的实验表明,相对于传统的查询扩展方法,在检索效果上取得了平均24.5%的提高. 相似文献
4.
5.
中文检索系统中查询的扩展 总被引:3,自引:0,他引:3
本文基于向量空间模型,提出了根据类别体系的层次结构,将特征项进行层次存储利用特征项所示的概念范畴的不同,以用户原始查询做进一步的扩展,文中详细介绍了用户查询扩展的方法,给出了查找某一特征项的下两层子特征项的算法。 相似文献
6.
7.
将完全加权关联规则挖掘技术应用于信息检索,提出一种基于完全加权关联规则挖掘和查询扩展的信息检索模型,重点阐述模型的设计思想及其算法和实现的关键技术.实验结果表明,该模型有效,能提高信息检索性能,有很高的实际应用价值和推广前景. 相似文献
8.
9.
查询扩展技术进展与展望 总被引:18,自引:0,他引:18
查询扩展技术是改善信息检索中查全率和查准率的关键技术之一,并成为近年来研究的热点.以查询扩展技术的发展为主线,将目前的研究方法归纳为三类:关键词查询扩展技术、查询词权重调整技术和语义概念查询扩展技术.对这三类扩展技术进行了整体性阐述和比较性研究,对一些关键性问题进行了探讨,并展望未来的发展趋势. 相似文献
10.
针对传统的信息检索模型只能进行精确匹配的问题,提出一种基于混沌神经网络模型的查询扩展方法,利用混沌神经网络较强的记忆性、学习性和联想性,对用户查询行为进行学习,从而对用户的初始查询进行扩展和重构,以得到符合不同用户的检索结果。与传统的神经网络信息检索模型的对比实验表明,新模型具有更高的查全率和查准率。 相似文献
11.
传统的邻近性检索模型同等地看待所有查询词,不加区分地考虑所有查询词的邻近性,造成“平行概念效应”,影响邻近性检索方法的性能。文中提出一种查询词相似度加权的邻近性检索方法。该方法根据查询词之间的语义相似度对查询词邻近性统计量加权,可进一步推断用户的实际信息需求,挖掘查询中蕴含的更深层次的信息。实验结果表明,在短查询较多的应用环境下,文中方法可较显著提升传统邻近性检索模型的性能,有效规避查询词邻近性的平行概念效应。 相似文献
12.
将Copulas理论引入文本特征词关联模式挖掘,提出融合Copulas理论和关联规则挖掘的查询扩展算法.从初检文档集中提取前列n篇文档构建伪相关反馈文档集或用户相关反馈文档集,利用基于Copulas理论的支持度和置信度对相关反馈文档集挖掘含有原查询词项的特征词频繁项集和关联规则模式,从这些规则模式中提取扩展词,实现查询扩展.在NTCIR-5 CLIR中英文本语料上的实验表明,文中算法可有效遏制查询主题漂移和词不匹配问题,改善信息检索性能,提升扩展词质量,减少无效扩展词. 相似文献
13.
14.
中文分词对中文信息检索系统性能的影响 总被引:7,自引:0,他引:7
中文分词作为中文信息处理最重要的预处理手段被广泛应用,该文从两个方面(检索精度和召回率)深入研究了中文分词精度和分词算法对中文信息检索性能的影响。此外,提出了两个假设,并在此基础上给出了一种提高中文信息检索系统性能的方法。实验表明,新方法能够取得很好的结果,证实了这两个假设。 相似文献
15.
16.
一种基于局部共现的查询扩展方法 总被引:16,自引:2,他引:16
针对信息检索中文档与查询之间的词不匹配问题,本文提出了一种基于局部共现的查询扩展方法LOCOOC。LOCOOC利用词项与所有查询词在局部文档集合中的共现程度来评估扩展词的质量,并整合了词项在语料集中的全局统计信息,使得选取的扩展词与初始查询所表征的主题或概念具有更好的相关性。实验结果表明:与未进行查询扩展时相比,采用LOCOOC方法进行扩展后,平均准确率提高40%以上;与传统的局部反馈方法以及局部上下文分析方法(LCA,Local Context Analysis)相比,LOCOOC不仅具有更优的检索性能,而且有着更好的鲁棒性。 相似文献
17.
近几年来,为了解决图像检索系统中由底层视觉特征和高层语义之间的差异所造成的检索困难,从信息捡索中引入了相关反馈技术。在过去几年中,它在该研究领域取得了一定的成功。文章提出了一种利用反馈信息建立“查询子空间”的检索模型,它将用户的语义查询进行基于视觉特征的分类,构造多个“查询子空间”,这些子空间拥有自身的查询模型和检索模型,最后的检索结果根据这多个“查询子空间”的检索结果得到。该模型具有较强的灵活性、扩展性,有效地利用了用户的反馈信息,动态地建立了底层视觉特征和高层语义之间的映射,能适应不同用户的查询。同时,将负反馈信息合理地融入到该模型中,提高了系统的检索效率。实验结果表明采用该检索模型的系统相比现有的检索系统性能有了较大提高。 相似文献