共查询到18条相似文献,搜索用时 93 毫秒
1.
基于领域本体和Lucene的语义检索系统研究 总被引:1,自引:0,他引:1
语义相似度是影响语义检索系统查准率和查全率的重要因素。设计了一种改进的语义相似度模型,用于量化概念间的关联程度,通过对相似度阈值的控制来调整查询扩展时扩展概念集的范围。在Lucene的基础上设计了一个基于领域本体的语义检索系统,该系统对提交的关键词组进行查询扩展后,将扩展关键词组导入文本检索引擎Lucene中,并把语义相似度作为检索结果排序算法的关键因素。实验结果表明,该语义相似度模型得出的相似度值更加接近专家经验值,系统的查询准确率与未加入查询扩展的Lucene系统相比有较大的提高。 相似文献
2.
针对单个网站构建本体库垂直搜索引擎的过程中,叙词及其间逻辑关系等收集整理所耗人力成本高,导致该技术框架虽成熟,而大多网站搜索功能仍以字符匹配为主,缺乏分词、查询扩展及结果的相关度排序,很难准确命中相关查询内容等问题,设计并开发了一套基于网站简约本体库的垂直搜索系统。该系统以中国气象数据网(http://data.cma.cn)为例,利用protégé根据网站的导航目录,构建了中国气象数据网的本体库,基于Lucene引擎构建技术框架,对本体库中的对象及网页内容分别进行分词,并构建本体对象索引库及网页索引库;前端对查询内容分词后,先在本体对象索引库中进行扩展,利用TF-IDF相关度算法计算扩展结果的相关度并排序,该值作为各扩展本体对象的权值,并将各自的权值动态赋给利用Jena二次语义分析技术扩展的对象,最后将所有带有权值的关键词在网页索引库中查询检索,计算结果相关度并排序。实验结果表明,该系统构建简便,能为用户扩展、推荐相关查询内容,提高了针对网站检索的查准率及查全率。 相似文献
3.
基于语义的概念查询扩展 总被引:2,自引:1,他引:1
针对当前信息检索系统中所存在查准率低和查全率低的情况,分析了当前检索系统中常用的方法后,提出了一种基于语义的概念查询扩展方法.该方法结合概念语义空间来实现用户检索的概念查询扩展,以达到提高查准率和查全率的目的.实验结果表明,该方法相对于传统方法可以大幅提高用户检索的查准率和查全率. 相似文献
4.
5.
在一种基于LUCENE的传统文本检索引擎之上,采用C/S架构模式的语义检索实验系统。用户可以根据需要,从客户端向服务器提交相应的查询信息配置,服务器根据此配置,通过本体导航与同义词查询2种查询扩展优化技术,对提交的查询关键词组进行查询、扩展等优化处理后,将经优化处理过的查询关键词组导入传统的文本检索引擎中,对文档资源进行匹配,将查询结果根据用户要求的排列,并依次返回给用户。通过用户与服务器的信息交互与对查询语句的查询扩展,该系统提高了查准率与查全率。 相似文献
6.
孔晨妍 《计算机与数字工程》2011,39(8):77-79,108
研究了本体描述语言OWL,提出并实现了一个基于本体和Lucene的语义检索模型,利用领域本体知识库对用户的查询要求进行语义扩展,构建了具有全文检索和语义检索功能的语义博客系统。实验证明语义检索方案在运行效能上可行,并且可以提供更高的查准率和查全率,对改进当前的检索系统是具有一定积极意义的。 相似文献
7.
Lucene是一个全文索引引擎工具包,具有访问索引效率高、支持多用户访问、跨平台等优点.把Lucene的索引与全文检索数据库的索引进行比较来介绍Lucene的索引原理及其结构组成,并分析通用的检索系统的组成.最后提出了通用的基于Lucene的全文检索系统的设计以及对实现的关键技术进行了探讨. 相似文献
8.
为了在检索过程中全面表达用户查询意图,提出了基于领域本体知识库的语义查询扩展方法。该方法借助领域本体推理出的知识,使检索系统从语义层面理解用户查询语句,并通过语义相似度来控制扩展词的规模,避免了查询过度扩展,使得新构造的查询能更准确地描述用户的检索需求,提高了检索的有效性。原型系统的实验结果表明,该方法较传统的关键字匹配法和LAC方法有明显的优势,在保障查全率的基础上,可极大地提高检索准确率。 相似文献
9.
对查询进行扩展的目的是找出查询中的潜在语义,确定用户意图,进而构造更适合于搜索引擎检索的查询语句,以提高检索的准确率。提出利用隐马尔可夫模型预测查询中的潜在语义的方法,该模型在大规模用户查询日志上进行训练。由该模型预测出的扩展语句查询的准确率较词共现扩展、同义词扩展等方案均有明显提升。 相似文献
10.
利用本体和Lucene全文检索技术实现了对网络教育资源管理检索的基本功能,包括基于本体的查询语义扩展、网络教育资源文档索引及其分类管理、文档检索、检索结果排序与分页、用户注册与登录等。系统遵循MVC模式,基于JSF框架构建Web应用,使用JPA实现ORM映射,将EL表达式嵌入JSF标签和JSTL标签,运用Facelets模板技术构建Web页面,基于Lucene包进行全文检索,通过OWL API解析教育资源领域本体,扩展用户查询请求语义,提高了查全率和查准率。测试表明,该系统运行稳定,可访问性、可靠性好,操作简便。 相似文献
11.
12.
13.
14.
针对传统查询扩展方法在专业领域中扩展词与原始查询之间缺乏语义关联的问题,提出一种基于语义向量表示的查询扩展方法。首先,构建了一个语义向量表示模型,通过对语料库中词的上下文语义进行学习,得到词的语义向量表示;其次,根据词语义向量表示,计算词之间的语义相似度;然后,选取与查询中词汇的语义最相似的词作为查询的扩展词,扩展原始查询语句;最后,基于提出的查询扩展方法构建了生物医学文档检索系统,针对基于维基百科或WordNet的传统查询扩展方法和BioASQ 2014—2015参加竞赛的系统进行对比实验和显著性差异指标分析。实验结果表明,基于语义向量表示查询扩展的检索方法所得到结果优于传统查询扩展方法的结果,平均准确率至少提高了1个百分点,在与竞赛系统的对比中,系统的效果均有显著性提高。 相似文献
15.
基于加权的本体相似度计算方法 总被引:1,自引:0,他引:1
为优化基于本体的语义推理效果,提出了对本体中概念结点赋予权重的相似度计算方法.通过定义本体树中深度因子和密度因子,以解决本体中概念深度与密度对相似度计算的影响.利用Jena API、Lucene等开源工具包,提出了查询扩展方法.实验结果表明,提出的基于加权语义相似度计算模型与传统的计算法方法以及主观判断的方法相比,提高了相似度计算的准确性,效率有明显提高. 相似文献
16.
17.