首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
垂直搜索引擎应用研究   总被引:1,自引:0,他引:1  
随着Internet 和WWW 的迅速发展,Internet 上的资源日趋丰富,使得人们在浩如烟海的互联网中得到有用的信息日益困难,垂直搜索引擎应运而生。文章简要介绍了垂直搜索引擎的关键技术及其在政府门户中的应用价值,主要研究了垂直搜索引擎在中央人民政府门户的应用。  相似文献   

2.
李占波  廖继东  李华 《微计算机信息》2007,23(24):194-195,165
36 网络信息资源的“爆炸”式增长使得人们获得有用信息日益困难,垂直搜索引擎应运而生。本文主要研究了下一代的搜索引擎-垂直搜索引擎,并利用Dotlucene建造一个中等规模的垂直搜索引擎,其关键字的拆分比对技术、信息检索的速度以及最终结果的排序都有独到之处.同时给出了部分核心算法。  相似文献   

3.
通过对垂直搜索引擎的原理和关键技术的研究,运用Lucene等JAVA开源工具设计并实现了一个手机信息检索系统。对于构建垂直搜索引擎必须要面对和解决的一些关键问题进行了分析,并给出了解决方案,如防止重复爬取网页和专业词库的扩展等,具有较强的实用性。  相似文献   

4.
严磊  马勇男  丁宾  郑涛 《福建电脑》2013,29(3):83-85
21世纪的今天,网络信息量呈几何倍数的增长。传统的通用搜索引擎已经不能很好的满足我们对特定信息的需求。所以,针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务的垂直搜索引擎应运而生。而主题网络爬虫则是为垂直搜索引擎提供数据的自动化程序。本文主要研究了主题爬虫的各种搜索策略,指出了其中的劣以及最后对将来的发展做出了一个展望。  相似文献   

5.
基于垂直搜索技术的搜索引擎解决方案   总被引:1,自引:0,他引:1  
搜索引擎是互联网检索技术的核心,随着互联网的迅速发展,目前的综合搜索引擎已无法满足用户的需求,这就成就了垂直搜索引擎的蓬勃发展,但处于发展初期的垂直搜索引擎还有很多不足,本文提出了一种基于垂直搜索技术的搜索引擎解决方案,以提高搜索引擎的工作效率。  相似文献   

6.
陈兰  金远平 《计算机应用与软件》2009,26(11):129-130,140
随着网络的飞速发展,人们对互联网信息检索的需求不断专业化、细致化,通用搜索引擎技术在一定程度上已经不能满足用户的搜索需求。与此同时,本体相关的技术在信息检索系统的研究越来越成熟。在本体相关技术的基础上,提出一种可以提高搜索效率的垂直搜索引擎构架,并着重对构架中的关键技术及其实现进行了研究。  相似文献   

7.
田晓辉 《福建电脑》2014,(11):29-30
本文主要阐述在搜索引擎的工作原理及索引机制下,通过网络蜘蛛程序等技术手段来得到一系列数据库数据和Lucene索引。针对互朕网的庞大数据量做有效的提取和分类,利用Spring和DWR的WEB架构设计技术来构建一个基于WEB的垂直搜索引擎。  相似文献   

8.
本文以金融领域为例,在搜索引擎日益发达的今天,如果更有效果的利用搜索引擎在网络中的应用,更准确及时地反映信息采用者所需要的金融信息,如果解决垂直搜索引擎在分析中的应用,并进行了详细的关键性技术分析。  相似文献   

9.
垂直搜索引擎可以实现行业主题的精准搜索,建设纺织品垂直搜索引擎,显然可以促进电子商务发展。该文论述了基于lucene的开源平台Nutch的特性和应用方法,分析了聚焦爬虫、分布检索等建立该引擎的关键技术。  相似文献   

10.
针对目前全文搜索引擎中存在的查准率较低、不能充分满足专业用户对搜索引擎的搜索需求的问题,设计一种基于元搜索技术的垂直搜索引擎系统结构。利用关联规则挖掘用户关注度较高的信息,提取这些信息中与关键词相关的隐形关键词,并用于扩展搜索。设计基于多关键词组搜索的改进的元搜索引擎位置排序算法。实验结果表明,与以前搜索引擎系统相比,该系统的专业相关度有了一定提高。  相似文献   

11.
一种新型网络信息采集器的研究   总被引:2,自引:0,他引:2  
为了克服内容评价搜索策略算法"近视"和链接分析算法"主体偏移"的缺点,提出了一种使用内容评价搜索策略和链接分析策略结合的算法.使用的方法开发网络信息采集器能够极大地提高用户的检索速度,并能有效地限制检索领域,大大减小检索结果的信息冗余度,使用户能够快速获取其真正需要的信息.研究表明使用内容评价搜索策略和链接分析策略结合的算法开发网络信息采集器能够提高垂直搜索引擎快、精、准等方面的性能.  相似文献   

12.
随着网络技术的快速发展,通用搜索引擎已经不能满足用户的一些需求,特别是当用户需要搜索某一领域内的信息时,垂直搜索引擎就正好符合这种需求。以手机资源为背景,通过运用扩展Heritrix和Lucene,构建了一个检索结果比较精准的垂直搜索引擎。研究了通过定制和扩展Heritrix从互联网上爬取相关的信息资源,利用HtmlParser工具对爬取的信息进行分析和抽取,运用Lucene建立全文索引和提供检索服务,并设计了MVC的查询接口。通过响应时间、查全率和查准率的测试实验表明,系统达到了设计目标。  相似文献   

13.
本文首先分析了互联网搜索引擎的现状,而后对垂直搜索引擎进行了系统设计,并阐述了系统实现的要点,最后对垂直搜索引擎的应用和特点做了总结,对读者了解垂直搜索引擎的概念和实现原理有一定现实意义。  相似文献   

14.
主要介绍了垂直搜索引擎和网络爬虫的基本概念,以及Heritrix系统的体系结构,分析了Heritrix工作流程,并通过扩展Heritrix实现了对网易手机频道信息的多线程抓取,为建立面向手机信息的垂直搜索引擎提供了信息源。  相似文献   

15.
将deep Web发掘与主题爬行技术有机地结合起来,对deep Web垂直搜索引擎系统的关键技术进行了深入研究.首先设计了deep Web主题爬行框架,它是在传统的主题爬行框架的基础上,加入了前端分类器作为爬行策略的执行机构,并对该分类器做定期的增量更新;然后使用主题爬行技术指导deep Web发掘,并且借助开源组件Lucene将主题爬行器所搜索的信息进行合理的安排,以便为检索接口提供查询服务.当用户向搜索引擎提交查询词后,Lucene缺省按照自己的相关度算法对结果进行排序.通过爬虫、索引器和查询接口的设计,实现了一个面向deep Web的垂直搜索引擎原型系统.  相似文献   

16.
基于网页布局及关键词组的垂直搜索技术   总被引:3,自引:0,他引:3  
提出了基于网页布局及关键词组的垂直搜索技术.在对特定信息进行抽取时,根据Web页面的布局特性,对页面采取分而治之的策略,同时在信息抽取时考虑各块之间的联系,以关键词组确定的关键节点为中心,与其他信息节点组成星形脉络图.实验结果表明,该方法具有较强的网页垂直搜索能力.  相似文献   

17.
汲业  陈燕  杨健  慕蓉 《计算机工程》2010,36(24):24-26
根据生活服务领域网页信息的特点,提出一种面向生活服务领域的垂直搜索引擎模型,给出该模型在信息采集、信息抽取、索引建立和信息检索4个功能模块的具体算法及实现方式。实际应用表明,该模型搜索效果良好,提供HTML和WML 2种方式的用户界面,已经成功覆盖全国近40个城市的餐饮、娱乐和黄页信息。  相似文献   

18.
面向垂直搜索引擎的Web站点划分方案   总被引:2,自引:1,他引:1       下载免费PDF全文
分析传统搜索引擎分配任务的方式及存在的问题,根据垂直搜索引擎的特点,提出一种比传统方法粒度更细的任务分配方式——网站划分。该分配方式将较大规模的网站切分为若干较小规模的子集,并将子集交给若干爬虫节点并行抓取,以加快爬虫系统的整体获取速率,作为对传统方法的有效优化。将网站划分算法应用于样本数据集,验证其有效性。  相似文献   

19.
针对垂直搜索引擎研究领域的关键技术问题,提出了一个结合本体筛选和文本挖掘的垂直搜索引擎构建思想.首先探讨了作为研究基础的本体和文本挖掘技术,讨论了两者的作用;之后阐述了垂直搜索引擎构建的关键技术,包括基于本体筛选的智能搜索器、结合文本挖掘的网页信息分析及抽取、索引器及查询处理器的构造;最后,对提出的思想进行了实现验证,构造一个面向高校毕业生招聘的垂直搜索引擎原型.  相似文献   

20.
网上信息搜索技术与搜索引擎   总被引:6,自引:1,他引:6  
随着Internet在全球范围内的迅速兴起,面对纷繁复杂的Web空间,如何在浩翰如海的信息空间里快速找到并取得所需的信息,便成为人们所关注的主要问题。搜索引擎的出现,极大地方便了Internet用户,使快速有效地获取信息成为可能。目前网上搜索引擎各种各样,有Yahoo!、Excite、AltaVista、Lycos、Infoseek、OpenText、WebCrawler、WWW Worm等几十种。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号