首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 484 毫秒
1.
越来越多的用户在使用搜索引擎时希望能提供快速有效的个性化的查询结果.根据搜索引擎的工作原理,在研究分析开源的搜索引擎工具Lucene的系统架构、模型和索引器的基础上,设计了武警部队网站个性化搜索引擎.通过二阶段数据处理流程实现信息的增量采集,通过采用逆向词典结构实现自动分词以及利用双向分词器进行倒排索引的功能,最后利用Tomcat服务器进行了部署实现.文中所设计的个性化搜索引擎提高了原Lucene搜索引擎的速度和准确率.  相似文献   

2.
丁兆贵  金敏 《微机发展》2011,(2):105-108
越来越多的用户在使用搜索引擎时希望能提供快速有效的个性化的查询结果。根据搜索引擎的工作原理,在研究分析开源的搜索引擎工具Lucene的系统架构、模型和索引器的基础上,设计了武警部队网站个性化搜索引擎。通过二阶段数据处理流程实现信息的增量采集,通过采用逆向词典结构实现自动分词以及利用双向分词器进行倒排索引的功能,最后利用Tomcat服务器进行了部署实现。文中所设计的个性化搜索引擎提高了原Lucene搜索引擎的速度和准确率。  相似文献   

3.
基于Nutch的中文搜索引擎的研究与实现   总被引:1,自引:0,他引:1  
重点讨论了搜索引擎原理及基于Nutch的搜索引擎的实现架构,同时对网页抓取过程作了深入的研究和分析。最后,给出了基于Nutch的中文搜索引擎的解决方案。  相似文献   

4.
搜索引擎的设计剖析   总被引:6,自引:0,他引:6       下载免费PDF全文
本文介绍了搜索引擎的四个组成部分:搜索器、索引器、检索器和用户接口,并分析其工作原理,给出搜索引擎中包含的关键技术算法,分词技术、多路归并算法和大文件处理技术;最后结合当前最新的几种搜索引擎在多语言处理,专业化和有效性等方面的技术改进目标。  相似文献   

5.
随着互联网的迅速发展,网页数量越来越多。人们对于网络信息专业化的需求导致了主题搜索引擎的诞生,而网络爬行器效率的高低以及算法的优劣将直接影响搜索引擎的很多性能指标,该文以高校为主题,探讨了设计主题爬行器的几个关键性问题。  相似文献   

6.
如何有效的搜索信息却是一件困难的事情。建立搜索引擎就是解决这个问题的最好方法。本文首先介绍了基于因特网的搜索引擎的系统结构,然后从网络机器人、索引引擎、Web服务器三个方面进行说明,并从个性化搜索引擎的“个性化”进行探讨。  相似文献   

7.
一种基于瞬索技术的搜索引擎的研究   总被引:1,自引:2,他引:1  
随着WWW上信息爆炸式的增长,对信息的查询提出了严峻的挑战,如何快速、准确而又全面的查询到所需信息是现代查询技术研究的关键。XML作为一种可扩展标记语言,具有HTML无可比拟的优点,使新的搜索引擎的研究成为可能。而最新研发的瞬索XML数据搜索引擎很好地利用了XML的优点,它实现了低成本的超高速数据搜索。本文在瞬索技术的基础上,设计了一个新的搜索引擎体系结构,该结构充分利用了瞬索技术的优点,可实现全面、快速的查询。  相似文献   

8.
集中式搜索技术有选择地找出与预定义主题集相关的页面,与传统搜索引擎相比具有可针对个人喜好定制,规模小、索引量少,更新查询速度快等特点,设计了一个集中式搜索引擎,并简要介绍该搜索引擎的系统结构,最后实现了一些关键算法。  相似文献   

9.
关于搜索引擎的研究综述   总被引:4,自引:0,他引:4  
由于目前搜索服务被越来越多的用户所认识和青睐,各样的搜索引擎也应运而生。文中阐述了搜索引擎的工作原理,并对搜索引擎按照不同的依据对其进行分类。介绍并比较目前较为有名气同时其发展历史也推进了搜索引擎的发展的几个搜索引擎,最后提出目前搜索引擎所存在的问题。  相似文献   

10.
为提高搜索的查准率和查全率,设计一个主题式的元搜索引擎和一个类似于爬行器的伪爬行器,通过调用通用搜索引擎采集信息,查全率高于通用搜索引擎。利用反馈机制,参考用户查询历史记录,搜索结果更加接近用户的要求。通过采用主题式策略,改进文档相似度算法,提高分类的正确率和搜索引擎的查准率与搜索范围,同时减少系统响应时间,降低对服务器性能的要求。  相似文献   

11.
随着因特网的迅猛发展,搜索引擎也在不断地发展.本文在分析传统搜索引擎弊端后,指出了搜索引擎发展的趋势:跨语言搜索引擎、多媒体搜索引擎、智能搜索引擎和基于智能代理技术的搜索引擎.最后,简要地给出了搜索引擎发展趋势所表现出的特点.  相似文献   

12.
关于搜索引擎的研究综述   总被引:6,自引:0,他引:6  
由于目前搜索服务被越来越多的用户所认识和青睐,各样的搜索引擎也应运而生。文中阐述了搜索引擎的工作原理,并对搜索引擎按照不同的依据对其进行分类。介绍并比较目前较为有名气同时其发展历史也推进了搜索引擎的发展的几个搜索引擎,最后提出目前搜索引擎所存在的问题。  相似文献   

13.
随着因特网的迅猛发展,搜索引擎也在不断地发展。本文在分析传统搜索引擎弊端后,指出了搜索引擎发展的趋势:跨语言搜索引擎、多媒体搜索引擎、智能搜索引擎和基于智能代理技术的搜索引擎。最后,简要地给出了搜索引擎发展趋势所表现出的特点。  相似文献   

14.
介绍Lucene的索引和排序技术,并对排序技术进行改进,利用Lucene开源全文本搜索技术框架建立全文检索系统,设计实现索引器、检索器、中文分析器等模块,完成一个基于Lucene的搜索引擎的应用。改进后的基于Lucene的全文检索系统能更好地支持中文及更准确地提供给用户所需要的信息。  相似文献   

15.
介绍Lucene的索引和排序技术,并对排序技术进行改进,利用Lucene开源全文本搜索技术框架建立全文检索系统,设计实现索引器、检索器、中文分析器等模块,完成一个基于Lucene的搜索引擎的应用。改进后的基于Lucene的全文检索系统能更好地支持中文及更准确地提供给用户所需要的信息。  相似文献   

16.
搜索引擎技术的新发展—多元搜索引擎系统   总被引:21,自引:0,他引:21  
在分析传统搜索引擎技术所存在不足的基础上,介绍了搜索引擎发展过程中出现的一种新技术-多元搜索引擎,深入分析了多元搜索引擎系统的组成结构。详细地考察了多元搜索引擎的发展状况,并对多元搜索引擎的系统指标进行了完整的评价。  相似文献   

17.
提出构建数字图书馆主题搜索引擎的总体系统设计。利用一个预处理系统尽量选择高质量的种子站点,从而产生Web主题定义数据;在系统控制器的协调下,各主题爬行器同步地采集爬行器所推荐的Web资源,对下载的资源进行文本分类与主题识别;将已经下载的Web资源按学科分类存储在Web主题资源库中,通过全局信息库建立索引,接入通用接口进行依主题检索。依赖数字图书馆各方面特点,提出支持多线程主题爬行器的设计,并提出一种新颖的URL主题相关性剪切算法EPR,为实现数字图书馆主题搜索引擎原型提供重要的设计。基于开源Lucene平  相似文献   

18.
搜索引擎中的反SEO作弊研究   总被引:2,自引:0,他引:2  
从搜索引擎优化服务开始,分析了现在所存在的搜索引擎优化的作弊手段;然后提出了四种方法用来预防、破解作弊,并结合现实总结提出逐级分层审查制度;最后结合Google搜索引擎,讨论并分析了Google搜索引擎的反作弊方法及其中的PR值算法。  相似文献   

19.
搜索引擎优化策略研究   总被引:1,自引:0,他引:1  
随着Internet的发展及网络资源越来越丰富,搜索引擎所起的作用也越来越大。因此搜索引擎优化作为一种可以提升网站在搜索引擎中的排名的网站优化技术,得到了广泛的关注。如何获得高的搜索引擎排名对网站特别是商务网站显得越来越重要。文章对搜索引擎优化策略进行了系统的总结,讨论了一些具体的优化方法,并对搜索引擎优化的发展前景进行了展望。  相似文献   

20.
为了使用户快速地从网页中找到所需要的内容,在设计搜索引擎时,需要更好地提高搜索引擎效率和精度,该文阐述了六种提高搜索引擎效率和精度的技术。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号