首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
查询扩展技术是在原有用户查询的基础上加入语义相关的新词,组成语义更准确的查询条件.文中对查询扩展算法中扩展词加权方法进行改进,提出一种基于初始用户查询意欲和词与词间语义关联性给扩展词加权的方法.根据此算法得到的扩展词权值不仅反映了该扩展词和原关键词间的关联性,还反映出该扩展词和查询关键词集合中所有元素的关联性.因此,可将基于语义树的查询扩展问题转换为扩展词权值wiis,o,p的计算,如何计算出权值wijs,o,p是文中的核心.实验证明,该算法提高了检索的查准率.  相似文献   

2.
查询扩展技术是在原有用户查询的基础上加入语义相关的新词,组成语义更准确的查询条件。文中对查询扩展算法中扩展词加权方法进行改进,提出一种基于初始用户查询意欲和词与词间语义关联性给扩展词加权的方法。根据此算法得到的扩展词权值不仅反映了该扩展词和原关键词间的关联性,还反映出该扩展词和查询关键词集合中所有元素的关联性。因此,可将基于语义树的查询扩展问题转换为扩展词权值wijs,o,p的计算,如何计算出权值wijs,o,p是文中的核心。实验证明,该算法提高了检索的查准率。  相似文献   

3.
陈海燕 《计算机科学》2015,42(1):261-267
词汇语义相似度的计算在网页浏览和查询推荐等网络相关工作中起着重要的作用.传统的基于分类的方法不能处理持续出现的新词.由于网络数据中隐藏着大量的噪音和冗余,鲁棒性和准确性仍然是一个挑战,因此提出了一种基于搜索引擎的词汇语义相似度计算方法.语义片段和检索结果的页数被用来去除词汇语义相似度计算过程中的噪音和冗余.此外,还提出了一种方法来整合查询结果页数、语义片段和显示的搜索结果的数量,该方法不需要任何先验知识与本体.实验结果显示,所提出的方法在Rubenstein-Goodenough测试集的相关系数为0.851,优于现有的基于网络的词汇语义相似度计算方法,同时在搜索引擎的查询扩展任务中具有较为良好的应用效果.  相似文献   

4.
在信息检索研究领域,资源与查询词的匹配决定信息检索质量。现有检索方法的检索结果存在过多不相关信息,不能很好满足用户需求。针对传统信息检索存在的问题与当前语义查询扩展方法的特点,本文在分析各种语义查询扩展方法及其相关研究的基础上,提出一种改进的基于领域本体的语义查询扩展方法。该方法论通过本体模型和概念相似度的计算对检索信息进行检索意图树的构建并扩展;然后在资源本体中以最短路径的方式搜索资源。实验结果表明,本文方法相较其他查询扩展方法能得到更好的检索结果。  相似文献   

5.
为了解决数据库空查询结果问题,提出了一种基于语义相似度的数据库自适应查询松弛方法.首先,基于初始查询条件和数据分布推测用户对查询指定属性的重视程度,据此提出了一种属性权重评估方法;然后,通过考察属性值的特征信息,分别提出了分类型属性值之间和数值型属性值之间的语义相似度评估方法;在此基础上,根据松弛阈值、属性权重和属性值...  相似文献   

6.
为了在检索过程中全面表达用户查询意图,提出了基于领域本体知识库的语义查询扩展方法。该方法借助领域本体推理出的知识,使检索系统从语义层面理解用户查询语句,并通过语义相似度来控制扩展词的规模,避免了查询过度扩展,使得新构造的查询能更准确地描述用户的检索需求,提高了检索的有效性。原型系统的实验结果表明,该方法较传统的关键字匹配法和LAC方法有明显的优势,在保障查全率的基础上,可极大地提高检索准确率。  相似文献   

7.
一种基于潜在语义分析的查询扩展算法   总被引:5,自引:0,他引:5  
该文提出一种新的查询扩展算法。通过对文本进行潜在语义分析,引入计算词语间语义相似度的方法,将文本聚类应用到检索的交互过程中,以提高信息检索的质量。实验结果表明该算法对于提高检索的准确率是十分有效的。  相似文献   

8.
为了解决普通用户对于Web数据库的不精确查询问题,提出了一种基于语义相似度的Web数据库不精确查询方法。对于一个给定查询,该方法首先在查询历史中找出一个(或若干)与其相似度高于给定放松阈值的查询,然后从数据库中找出与这些查询相匹配的元组作为当前查询的不精确查询的结果,最后将这些查询结果按其对初始查询的满足程度进行排序。实验结果表明,提出的不同查询之间的语义相似度评估方法性能稳定、评估结果合理,不精确查询方法具有较高的查全率和排序准确性。  相似文献   

9.
基于加权的本体相似度计算方法   总被引:1,自引:0,他引:1  
为优化基于本体的语义推理效果,提出了对本体中概念结点赋予权重的相似度计算方法.通过定义本体树中深度因子和密度因子,以解决本体中概念深度与密度对相似度计算的影响.利用Jena API、Lucene等开源工具包,提出了查询扩展方法.实验结果表明,提出的基于加权语义相似度计算模型与传统的计算法方法以及主观判断的方法相比,提高了相似度计算的准确性,效率有明显提高.  相似文献   

10.
孙航 《电脑与信息技术》2012,20(4):44-45,60
文章提出一种优化查询方法,该方法将本体概念语义相似度和词法之间的关系相结合。先利用语法特征对用户输入的关键字进行扩展,然后通过分析语义相似度的强弱对扩展的结果进行收敛,以这种方式来提高用户输入的关键字和本体映射的准确性和完整率。传统搜索引擎不能很好地理解用户的意图的缺陷通过此方法可以得到有效解决。同时文章针对方法实现了优化查询系统,结果显示,搜索的准确率得到有效提升。  相似文献   

11.
查询扩展是优化信息检索的有效途径。为此,提出一种基于语义分析的查询扩展方法,利用基于互信息的共现模型分析初检文档,并将其作为部分扩展源,用模型的统计结果剪枝由语义词典WordNet生成的语义树,限制扩展范围。从初检文档和语义词典两方面选取扩展词对原查询进行扩展形成新的查询集。对返回结果进行重排序,调整前n篇文档的查准率。实验证明该方法是切实可行的。  相似文献   

12.
李莉  高庆狮 《计算机科学》2008,35(2):201-204
查询扩展技术通过向初始查询请求中加入相似或者相关的词,来减少查询请求与相关文献在表达上的不匹配现象,改善检索性能.本文利用语义单元的语义表达能力和语义单元之间的关系,将与初始查询具有密切语义关系的查询词或短语加入到初始查询请求中,更加全面地表示了用户的查询意愿.算法的时间复杂度为O(L),只与搜索请求的长度L有关,与语义单元表示库的规模无关,这对实时性要求较高的搜索引擎来讲是很实用的.  相似文献   

13.
将语义扩展与统计扩展相结合,提出了一种基于本体和局部共现的查询扩展方法,该方法利用本体和局部共现分别得到语义候选扩展概念集和统计候选扩展概念集,对这两个扩展集进行二次筛选以得到最终的查询扩展概念;并给出了一种计算扩展词权重的方法。实验结果表明,扩展后的查询更能反映用户的查询请求,在设计的语义检索系统中,该方法能有效提高查全率和查准率。  相似文献   

14.
矫健  张仰森 《计算机科学》2014,41(12):168-171,188
对查询进行扩展的目的是找出查询中的潜在语义,确定用户意图,进而构造更适合于搜索引擎检索的查询语句,以提高检索的准确率。提出利用隐马尔可夫模型预测查询中的潜在语义的方法,该模型在大规模用户查询日志上进行训练。由该模型预测出的扩展语句查询的准确率较词共现扩展、同义词扩展等方案均有明显提升。  相似文献   

15.
张书波  张引  张斌  孙达明 《计算机科学》2016,43(Z6):485-488, 496
基于语义资料和局部分析的混合式查询扩展可以同时提供具有语义相关性和时效性的扩展结果,但如何有效地混合不同相似度度量指标是尚未解决的问题。提出了一种基于Copulas框架的混合式查询扩展方法,在统一框架内实现了不同类型相似度度量指标的合并。该方法基于语义分析及词语共现分析方法,分别计算扩展词与用户查询词的语义及统计相似概率,进而在Copulas框架下融合扩展词集,选取最高质量的扩展词形成查询扩展。实验结果表明,该方法充分利用了语义及词语共现分析查询扩展方法的优点,有效地弥补了两者的不足,提高了搜索结果的查准率,具有更优的搜索性能。  相似文献   

16.
王旭阳  萧波 《计算机工程》2012,38(7):57-59,69
语义查询扩展中存在语义边界确定困难的问题。为此,提出一种基于本体和局部上下文分析的查询扩展方法。在本体扩展得到候选扩展概念的基础上,改进筛选函数,结合局部上下文对候选扩展概念集进行二次筛选。实验结果表明,与基于本体的查询扩展方法相比,该方法的查询性能较高。  相似文献   

17.
伪反馈一直以来都被认为是一种有效的查询扩展技术.但是近来的研究表明传统的伪反馈容易带来主题漂移并因此而影响检索性能.如何确定相关文档以及如何从相关文档中挑选有用的扩展词项是伪反馈中两个重要的方面.与传统查询扩展不同,XML查询扩展不仅需要内容扩展还需要考虑结构扩展.提出了一个解决框架,利用聚类和词组抽取技术来查找相关文档和选择有用的扩展信息.结合XML的语义特征,提出了一种全新的基于层次信息的文档相似性度量方案.基于此,将初始检索结果聚类,获得与查询请求最为相关的文档簇,然后在文档簇中抽取词组,找到符合用户查询意图的扩展查询词组,并在扩展查询词组的基础上进行结构扩展,最终形成完整的"内容+结构"的查询扩展表达式.IEEE CS实验数据上的实验结果表明,结合了聚类和抽取技术的XML伪反馈查询扩展方法能有效地降低主题漂移现象,获得更好的检索质量.  相似文献   

18.
专利检索是专利挖掘任务的重要前置子任务,而查询扩展对于提高专利检索方法的准确率和召回率有重要作用。专利文档具有高频率的非标准技术术语以及创造词的特点,传统的查询扩展方法并没有考虑这一特点,会导致专利检索子任务难以获取用户完整的查询意图;此外,在专利查询扩展过程中不可避免地会引入噪声词,出现主题漂移现象,导致查询召回率降低。为了解决这些问题,提出了一种基于社区发现的专利查询扩展方法,该方法建立以专利主题词为节点,主题词之间关系为边的专利主题词图,将专利查询扩展问题转化稠密子图搜索问题,利用社区发现算法实现问题求解。在基准数据集CLEP-IP 2010上开展实验,结果表明与现有的专利扩展查询方法相比,与基准方法相比召回率提高了约7.1%,PRES改善了近3.2%。  相似文献   

19.
查询扩展作为一门重要的信息检索技术,是以用户查询为基础,通过一定策略在原始查询中加入一些相关的扩展词,从而使得查询能够更加准确地描述用户信息需求。排序学习方法利用机器学习的知识构造排序模型对数据进行排序,是当前机器学习与信息检索交叉领域的研究热点。该文尝试利用伪相关反馈技术,在查询扩展中引入排序学习算法,从文档集合中提取与扩展词相关的特征,训练针对于扩展词的排序模型,并利用排序模型对新查询的扩展词集合进行重新排序,将排序后的扩展词根据排序得分赋予相应的权重,加入到原始查询中进行二次检索,从而提高信息检索的准确率。在TREC数据集合上的实验结果表明,引入排序学习算法有助于提高伪相关反馈的检索性能。  相似文献   

20.
随着数字内容不断增长,信息检索技术已经不能满足不同用户对高精度信息内容获取的需求.文中提出基于多语义关系的个性化查询扩展方法,并应用于基于社会化标签的个性化搜索系统.模型使用标签-主题模型对用户兴趣模型进行建模,能够更有效地表达语义和提升搜索效果.在此基础上,进一步提出基于多语义关系的个性化查询扩展方法,利用社会化标签的多重语义特征进行扩展词的选择.在大规模真实社会化标签数据集上的实验表明,文中方法优于非个性化搜索及其它基于社会化标签系统的个性化查询扩展方法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号