共查询到19条相似文献,搜索用时 78 毫秒
1.
查询扩展可以有效地消除查询歧义,提高信息检索的准确率和召回率.通过挖掘用户日志中查询词和相关文档的连接关系,构造关联查询,并在此基础上提出一种从关联查询中提取查询扩展词的查询扩展方法.同时,还提出一种查询歧义的判别方法,该方法可以对查询词所表达的检索意图的模糊程度进行有效度量,也可以对查询词的检索性能进行预先估计.通过对查询歧义的度量来动态调整扩展词的长度,提高查询扩展模型的灵活性和适应能力. 相似文献
2.
提出将概念图引入查询扩展,从概念的层面上进行语义的扩展。使用概念图表示查询可以更准确地表明用户的查询意图,并在此基础上进行语义的扩展,通过这种方法给出的扩展查询更符合用户的查询意图。对用户查询进行基于概念图的查询扩展,并将结果与百度的相似查询进行了比较,证明基于概念图的查询扩展能更准确地把握用户的查询意图。 相似文献
3.
基于用户兴趣的查询扩展语义模型 总被引:1,自引:0,他引:1
罗建利 《计算机工程与应用》2006,42(32):126-130
自然语言中词的同义现象和歧义现象一直是降低信息检索查全率和查准率的关键,在Web搜索引擎上显得更加突出。提出了一种基于用户兴趣的查询扩展语义模型,通过构建基于Yahoo的语义ontology知识库消除同义现象,设计客户端的用户兴趣挖掘模型消除歧义现象。实验结果显示该方法能有效提高Web信息检索的查全率与查准率。 相似文献
4.
一种基于本体和用户日志的查询扩展方法 总被引:1,自引:0,他引:1
为了解决信息检索中存在的用词歧义性问题,提出一种基于本体和用户日志的查询扩展方法。利用领域本体从语义层面扩展用户查询形成初始扩展概念集,结合用户查询日志利用共现度分析对初始扩展概念集进行二次筛选。实验结果表明,与传统的基于局部共现的扩展方法和基于本体的扩展方法相比较,该方法在保障良好鲁棒性的同时,有效地提高了检索准确率。 相似文献
5.
6.
基于本体和用户相关反馈的扩展查询研究 总被引:2,自引:1,他引:1
描述了一种扩展查询(QE)的新方法,这是一种连接用户相关反馈和本体的混合扩展查询技术,有两大贡献:一是连接了用户相关反馈和本体技术,二是采用FirteX作为实验平台。与目前广泛应用的基于余弦相似性的扩展查询技术相比,实验结果表明方法平均精度达到15%,高于基于余弦相似性的扩展查询技术的13%,并且将平均反馈率提高到了16%。 相似文献
7.
网络搜索引擎的用户查询分析 总被引:14,自引:1,他引:13
利用教科网搜索引擎“网络指南针”的查询记录,就其中102439个用户的810396次查询,在用户查询方式、查询表达表达以及查询词3个层次上,对用户查询行为进行了分析,得到了搜索引擎用户查询的一般规律。根据上述结论对搜索引擎的进一步发展进行了讨论。 相似文献
8.
查询扩展是信息检索技术研究的一个重要组成部分。目前的查询扩展是基于统一的用户模型,没有考虑到用户的个人兴趣,这对查询扩展的精确度造成了一定的影响。分析了产生这种问题的原因,提出了基于概念图的用户兴趣扩展模型,通过该模型来有效提高查询扩展的精确度。实验显示,该方法能有效提高查询的查全率和查准率。 相似文献
9.
对查询进行扩展的目的是找出查询中的潜在语义,确定用户意图,进而构造更适合于搜索引擎检索的查询语句,以提高检索的准确率。提出利用隐马尔可夫模型预测查询中的潜在语义的方法,该模型在大规模用户查询日志上进行训练。由该模型预测出的扩展语句查询的准确率较词共现扩展、同义词扩展等方案均有明显提升。 相似文献
10.
针对传统的信息检索模型只能进行精确匹配的问题,提出一种基于混沌神经网络模型的查询扩展方法,利用混沌神经网络较强的记忆性、学习性和联想性,对用户查询行为进行学习,从而对用户的初始查询进行扩展和重构,以得到符合不同用户的检索结果。与传统的神经网络信息检索模型的对比实验表明,新模型具有更高的查全率和查准率。 相似文献
11.
12.
针对信息检索中查询与文档集之间可能存在的“词不匹配”问题,基于兴趣模型提出一种将概念化的兴趣知识与向量空间模型相结合的查询扩展方法。该方法能根据阈值来判断查询扩展是否可行。用户的兴趣偏好是通过Agent代理实时获取的,兴趣知识采用HNC(Hierarchical Network of Concepts, 概念层次网络)理论的概念符号体系表达,这样便于计算概念之间的相似度。实验结果表明,经过查询扩展后的结果相对于未加入查询扩展的结果在性能上提高了29.1%。 相似文献
13.
14.
查询扩展作为一门重要的信息检索技术,是以用户查询为基础,通过一定策略在原始查询中加入一些相关的扩展词,从而使得查询能够更加准确地描述用户信息需求。排序学习方法利用机器学习的知识构造排序模型对数据进行排序,是当前机器学习与信息检索交叉领域的研究热点。该文尝试利用伪相关反馈技术,在查询扩展中引入排序学习算法,从文档集合中提取与扩展词相关的特征,训练针对于扩展词的排序模型,并利用排序模型对新查询的扩展词集合进行重新排序,将排序后的扩展词根据排序得分赋予相应的权重,加入到原始查询中进行二次检索,从而提高信息检索的准确率。在TREC数据集合上的实验结果表明,引入排序学习算法有助于提高伪相关反馈的检索性能。 相似文献
15.
16.
17.
由于自然语言本身的歧义性和多样性,少数几个关键词难以表达真实的信息需求。查询扩展技术通过挖掘原始查询项的潜在信息,有效地增强了检索系统的理解能力。该文在上下文分析方法计算公式中加入了句子权重概念,即假设由原始查询项返回的句子越重要,则其中出现的词与查询项越相关。同时进一步假设,句中的词与查询项的位置关系与依赖关系也是选取扩展词的重要依据。为此,该文分别提出基于句子权重与位置上下文分析方法(Sentence Weight&Position-based Context Analysis,SWPCA),以及基于句子权重与依赖关系上下文分析方法(Sentence Weight&Dependency-based Context Analysis,SWDCA)。并将这两种查询扩展技术应用于TREC的定义类问题回答,数据显示这两种方法均取得不错成绩,而SWDCA性能更好。 相似文献
18.
基于相关文档池建模的查询扩展 总被引:7,自引:0,他引:7
在信息检索领域,相关反馈是提高检索性能的有效方法之一。所谓相关反馈,指用户按照一定策略从查找到的相关文档中选择一些和主题相关的词进行查询扩展的技术。本文介绍了概率模型和向量空间模型下的常用查询扩展方法,并提出了一种基于语言模型的相关反馈方法,该方法同时考虑了扩展词应该具备的两个特征,即相关性和覆盖性。在TREC测试集上对这些算法进行了比较,结果表明这种新算法在平均准确率上比传统方法有所提高。 相似文献