首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 281 毫秒
1.
为解决现有语义模糊可搜索加密方案无法取得排序可验证的问题,提出一种支持语义模糊搜索并能对搜索结果的排序进行验证的方案。首先引入相关度分数和域加权得分,构造精确度更高的倒排索引结构。通过非线性保序加密,云服务器可以对搜索结果进行高效排序,减少了用户的计算开销和网络资源浪费。接着基于WordNet词典集对查询关键词进行语义拓展。在构造出语义拓展树后,只选取最相关的语义拓展词进行查询。通过引入语义相似度,设计双因子排序算法对搜索结果进行精确排序。然后为创建验证信息,将关键词集合插入布隆过滤器中,并计算布隆过滤器、安全索引、密文文档的消息认证码。在搜索阶段,通过布隆过滤器可以验证索引中是否存在查询关键词,并使用消息认证码对索引、文档的完整性和正确性进行验证。通过引入索引树结构进一步提高方案的搜索效率。最后,将本方案与相关方案在功能、存储开销、搜索开销等方面进行比较,并对创建索引、创建验证信息、语义拓展、加密查询、查询、验证等方面的开销进行仿真实验。方案对比分析显示本方案在语义搜索、排序、验证等功能上具有优势。实验结果表明,本方案不仅实现了语义模糊搜索与结果排序,而且实现了排序结果可验证功能。  相似文献   

2.
基于潜在语义索引技术提出一种大容量文本的快速检索算法.首先,利用奇异值分解方法对向量空间模型进行改进,充分考虑词项之间的相关性,在低维空间中表示待检索文本的各个段落与查询文本;其次,利用随机分块查询算法,以查询文本和待检索文本各段落之间的余弦相似度作为适应度函数进行检索,输出相似度超过阈值的候选段落;最后,通过仿真实验验证了该方法的有效性.实验结果表明,该算法可以根据段落的语义进行文档的搜索,可以为查询大容量文档提供有效的手段.  相似文献   

3.
为提高搜索引擎的查准率,提出了一种基于群用户兴趣模型的加权全局相关度查询排序算法。算法综合考虑了用户搜索意图与搜索结果的全局相关度,改进了搜索引擎的排序结果,为用户提供了准确的搜索服务。实验结果表明,与用户意图相关的搜索结果能够排在最前面,搜索准确率明显提高。  相似文献   

4.
摘要:提出了一种对象级搜索中领域无关的对象排序模型.给定对象集合以及对象间的关系,根据用户输入的对象查询,该模型按照对象与查询的相关度输出一个对象的排序表.采用一个多平面的图表示对象级搜索的空间,并基于该图分别提出了对象流行度评估算法、根据查询计算相关度的算法,以及合并多个对象查询的算法.针对ACM数据集上的实验结果表明该算法是有效的,在论文推荐与合并多对象查询方面,均取得了比PaperRank更好的结果.  相似文献   

5.
为了解决微博检索面临的"用户查询"和"相关文档"都是极端短文本的情况,及由此造成的检索性能欠佳的难题,研究并实现了一种微博检索结果的二次重排算法,基于微博内容相似关系构建关系图模型,利用PageRank算法对微博检索结果进行二次排序.比较了基于余弦相似度、戴斯系数、单向戴斯系数等文本内容相似度计算方法.实验结果表明:二次排序算法能够有效提升微博检索性能,同时图模型迭代性能与相关主题比例存在依存关系.有鉴于此,讨论通过决策树重排算法去除非相关主题对微博排序的影响.  相似文献   

6.
为了解决传统分布式搜索引擎存在的搜索性能问题,从索引结构、查询算法方面改进了传统模型.提出了一种非集中的高并行化搜索模型,该模型按照文档主题对索引分类,对较长的倒排记录表采用位图结构,利用多线程技术对索引节点实现并行搜索算法(multi max score heap,MMSH).实验结果表明:改进模型中的索引分类方法与倒排表结构的位图策略,能够增强Merge层查询的针对性,降低Merge层节点的CPU和内存开销;在倒排表不能完全存入内存情况下,MMSH算法能够实现高度并行化查询,其查询效率高于经典的term-at-a-time算法,缩短了平均查找时间,提高了系统吞吐量.索引分类、位图结构以及并行查询算法能够避免查询的盲目性,改善了分布式搜索引擎的性能.  相似文献   

7.
深入讨论了基于向量空间模型以及基于潜在语义分析的微博搜索排序算法,以新浪微博为例,通过建立实验系统,利用新浪微博公共开放平台提供的API获取实验数据,通过一个实验样例阐述向量空间模型和潜在语义分析的处理过程。新浪微博现有排序方法通常不能提供按照相关性排序的满意结果。利用向量空间模型以及潜在语义分析方法,构建"索引词-博文"矩阵,对博文进行分词和向量化。衡量博文和查询的相关度转化成计算博文向量和查询向量之间的相似度。把对博文和查询的处理简化为向量空间中向量的运算。由实验得知基于潜在语义分析的微博搜索排序算法有效地提高了博文的检索效率。  相似文献   

8.
传统的信息检索系统都是按照结果与用户查询的相关性大小进行排序,返回结果之间相互孤立缺乏整体性,冗余性很大.为了使用户获得完整的相关信息,采用一种基于子主题提取的文档集合生成算法聚类相关检索结果,引入一个新概念"并集度",最后利用相关度、并集度和新颖度对结果集重新排序.实验结果表明在进行算法改进后,整体相关度有所上升,同时排在前面的文档集合的并集度和新颖度也较大,包含的信息更加完整,冗余性更小,可以更好地满足用户的查询需求.  相似文献   

9.
改进遗传算法与粒子群优化算法及其对比分析   总被引:18,自引:0,他引:18  
进化算法作为一类新的优化搜索方法,广泛应用于各种优化问题.现对简单遗传算法进行了改进,采用实值编码,并与模拟退火算法及基于适值排序和随机选择的方法相结合,形成了改进遗传算法.同时还介绍了一种新的进化算法一粒子群优化算法.将这两种优化算法应用于函数优化,并对优化结果进行了对比分析.比较结果表明,改进遗传算法和粒子群优化算法都可以在函数优化方面表现出较好的健壮性,但在找寻最优解的效率上,粒子群优化算法较好.  相似文献   

10.
基于全文检索工具包Lucene的排序技术   总被引:2,自引:0,他引:2  
为了深入理解Lucene使用的排序技术和实际应用,需要研究矢量信息检索模型和td-idf加权策略.根据影响排序的因素,提出了Lucene的文档得分算法,分析了各因素对排序结果的影响.结合实例对基于Lucene排序的相关API进行应用,以提升Lucene排序的性能.  相似文献   

11.
针对采用GOP结构的低码率视频,提出了一种结合了信源失真特性与信道失真特性的信源编码的速率控制算法。该方法基于以GOP为单元的端到端的动态率失真模型,利用最小代价优化法搜索各帧的最佳量化参数。在不改变信源编码速率限制的条件下,通过合理地调整各帧之间的比特分配,有效提高了端到端的视频质量。实验表明,与JVT-G012相比,本文提出的速率控制算法对于中高速运动的视频序列PSNR的平均增益可达1dB以上。  相似文献   

12.
为解决传统的文档分类方法和手工分类方法都不适宜于处理查询分类的问题,提出了一种基于Web的自动构建特定主题的语义词典的方法来分类搜索查询,通过基于主题的Web信息采集和bootstrap-ping,由某个主题的少量关键词逐步扩充,最终得到该主题的语义词典及词典中每个单词的相对词频.Web中信息的冗余和各主题语义上的差别使各主题的语义词典中单词的种类和数量存在很大差异,这种差异可以用来对用户的搜索查询进行分类.实验结果表明,利用语义词典可以较准确地将用户的查询分类,同时该分类方法基本上不需要人工介入,且可适应搜索查询覆盖面广和实时性强的特点,较好地解决了搜索查询分类的问题.  相似文献   

13.
可行能力是指个体有可能实现的、各种可能的功能性活动组合,基于可行能力理论,以江苏地区2013届大学毕业生为研究样本,运用多层线性回归分析方法,探讨可行能力对大学毕业生工作搜寻绩效的影响。研究结果表明,可行能力对大学生工作搜寻绩效和心理资本具有显著的正向影响,心理资本在可行能力对大学生工作搜寻绩效的影响过程中起部分中介作用,能够强化可行能力对工作搜寻绩效的影响。因此,提高大学毕业生工作搜寻绩效的重点,在于不断提升可行能力并开发心理资本。  相似文献   

14.
由于近年来网络信息的快速增长,导致传统的搜索引擎在检索过程中会返回大量的不相关内容.针对这一问题,提出一种基于模糊概念网络的多代理个性化搜索引擎,主要利用模糊概念网络去学习用户的兴趣,并写入用户配置文件,然后根据用户配置文件去过滤多代理服务器检索出的信息,最终实现一个高效的个性化搜索引擎.实验表明,通过本文提出的搜索引擎检索出的结果要比传统搜索引擎检索出的结果相关度更高.  相似文献   

15.
针对现有搜索引擎的搜索结果数目庞大要从中找到有用信息十分困难的问题,基于将Web搜索结果进行聚类可以方便用户快速浏览搜索结果的思想,提出了一种基于形式概念分析的Web搜索结果聚类方法。首先从搜索结果中集中提取关键短语和非关键短语,然后从搜索结果集到关键短语和非关键短语集上建立形式背景,采用一种较快概念格生成算法在该形式背景上生成概念格,概念格上的一个概念表达了具有确定意义的主题,即得到Web搜索结果的一个类:每个概念内涵具有的关键短语或非关键短语作为类标记;概念的外延所包含的搜索结果文档作为该类的内容;搜索结果各个类之间的层次关系通过概念格上的层次关系得以体现。  相似文献   

16.
为了改进传统的文本检索技术存在检索文件格式种类单一,索引大数据量文件速度慢,甚至造成内存溢出等问题,基于Lucene系统及相关技术,研究了基于合并因子的多种格式文件索引技术,并在此基础上构建了中文文本信息检索系统.实验分析表明,本系统有效地实现了多种格式文件检索功能,通过合并因子的设定有效提高了索引速度,系统可靠性高.  相似文献   

17.
提出一种基于T-S模糊故障树分析的故障搜索策略。以某型液压载重车支腿液压系统故障树为例,在给出T-S模糊故障树基本事件的T-S关键重要度概念和计算方法的基础上,综合考虑基本事件的T-S关键重要度和搜索费用等因素,采用逼近理想解排序法(TOPSIS)计算出故障方案的搜索顺序。该方法克服了传统故障树分析方法在故障搜索中二态假设的局限,分析了在不同顶事件故障程度的条件下的故障搜索策略,增加了故障搜索结果的准确度,提高了故障诊断的可行性。  相似文献   

18.
提出了一种基于算术编码的文本数据压缩算法,将扫描产生的偏移量、匹配数据长度等全局优化问题转化为局部优化问题,并从Glomb编码思路出发,推导出一种参数选择算法;对LZ77算法进行修正,提出一种预测编码方法,获得预测参数。对预测参数、偏移量、数据匹配长度、保留文本数据使用MQ算术编码器进行编码,针对不同类型数据,设计出不同的编码算法和相应的上下文算法。对算法进行仿真,并与Winzip、WinRar压缩效率进行比较,结果表明对纯文本数据、Word文档数据、C语言程序代码,图像数据等,该压缩算法优于Winzip;在纯文本数据、Word文档数据、C语言程序代码压缩方面与WinRar相当或者略好,但在图像压缩方面的性能与WinRar相比略有不足。  相似文献   

19.
针对目前互联网上使用的音乐检索系统是以文本信息为主要搜索依据,难以满足智能化检索需求的问题,提出了一种基于内容的音乐检索方法。在保留传统检索方法的基础上,将情感和场景需求引入到检索中,对基于语义的音乐检索方法及模型进行了相关研究。首先根据音乐所蕴含的意境及适合播放的场景进行分析,构建音乐领域本体;然后对用户提出的查询请求进行分词分析和词性标注,并进行语义分析;最后通过推理机对本体进行推理,检索出满足用户需求的音乐集。  相似文献   

20.
如何设计有效的相关性排序函数是信息检索研究的一个核心问题,因为排序函数直接影响着搜索结果的质量。排序函数的好坏一般由信息检索评价方法进行评估,对其进行优化的主要困难是这些方法都依赖于结果文档的排序位置,因此对于查询的结果返回列表中相关文档的位置的研究是十分重要的。通过探索相关文档和不相关文档之间的偏序关系构造新的输入样本;该样本是由一个相关文档和一组不相关文档所构成的,它能够更加有效的区分文档的相关性;基于该输入样本,通过定义位置损失函数对排序结果进行优化。在公开数据集Letor30的上的实验结果显示该方法可以将多种排序评价方法的准确率平均提高2%,证明了所提出的方法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号