首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
Web搜索引擎框架研究   总被引:42,自引:1,他引:42  
Web搜索引擎是Internet上非常有用的信息检索工具,但是由于目前搜索引擎检索出的信息量庞大,且一个特定的搜索引擎主要包含某一特定领域的信息,这使得用户很难从某一个搜索引擎获得准确的导航信息。文中提出一个新的Web搜索引擎框架GSE,并提出了一个适合于Web信息获取与处理的语言WERPL。通过WIRPL可以将多个Web搜索引擎结合起来,为用户提供一个一致、高效、准确的Web搜索引擎。  相似文献   

2.
元搜索引擎及其实现   总被引:14,自引:0,他引:14  
单个搜索引擎的索引和处理能力的提高赶不上Web数据的快速增长,结果是任何单个搜索引擎只能索引Web的一部分文档,用户需要的文档分布在许多搜索引擎的文档数据库中,元搜索引擎是架构在许多搜索引擎之上的搜索引擎,它利用各个成员搜索引擎提供的服务,能够高效方便地找到这些文档,然后合并成员搜索引擎返回的结果呈现给用户,实现了一个元搜索引擎系统,并给出建立一个高效的元搜索引擎的关键技术和经验。  相似文献   

3.
Internet上的文本数据挖掘   总被引:48,自引:3,他引:48  
1 引言今天Internet已不再是科学家及工程师们独享的通讯工具,已成为数字化时代的世界性图书馆,变成了为各行各业的人们交流思想、获取信息的便利手段。人们在使用WWW浏览服务时,检索、获取最多的信息数据就是文本数据。但这种在巨大的Internet信息仓库中占信息比重最大的数据类型却缺乏结构化、组织的规整性,并且随意地散布在这个网络的各个角落,还降低了人们对丰富的信息资源的利用效率。数据挖掘是人们对一些巨型数据库中的数据进行分析、使用感到力不从心时而发展出的一门新的技术,它将人工智能技术与数据库技术紧密结合起来,让计算机帮助人们从庞大的数据中智能地、自动地抽取有价值的知识模式,以满足人们不同应用的需要。当数据挖掘的对象完全由文本这种数据类型组成时,这个过程就称文本数据挖掘。Internet上缺乏结构化、组织规整性的超巨量文本数据自然让人们想到运用文本数据挖掘技术来帮助提高人们在Internet上检索信息、利用信息的效率。  相似文献   

4.
Web搜索引擎综述   总被引:20,自引:1,他引:19  
1 引言互联网络的历史只能从1960年代后期算起。从早期的ARPANet,到目前的Internet,互联网飞速发展,基于互联网的各种应用也应运而生。互联网上的信息也越来越多,因此迫切要求一种信息检索工具。1991年,XWAIS提供了一个界面友好的信息搜索系统,但是这个系统要求很特殊的文件格式。在同一年出现了另外一个信息检索系统GOPHER,GOPHER一时成为最为流行的检索工具。由于GOPHER基于字符界面,一般的互联网用户还是很少使用它。真正让互联网普及的转机出现在1993年。当年美国国家计算机安全协会NCSA推出第一个基于HTML语言的可以浏览图形的浏览器Mosaic。它使得普通的用户可以轻松地使用互联网。1994年,美国网景公司推出免费浏览器Netscape。这使得以HTML为格式的信息迅速膨胀。是年,Yahoo公司创立,它提供基于目录的信息检索服务。而真正意义上的搜索引擎创建于1994年春天的Lycos,当时Michael Mauldin将John Leavitt的“网络蜘蛛”(spider)程序接入到其索引程序中。  相似文献   

5.
Web信息检索服务系统与搜索引擎   总被引:6,自引:2,他引:6  
引言由于WWW的信息量在不断地增加,而且不断地动态更新,人们研制了许多web索引与检索服务系统以帮助用户查找信息。按照信息收集和索引的方式,大体上可将Web索引与检索服务系统分为三类。第一种是将手工收集到的信息编成HTML文件,按某种次序排列组织,使用户可以通过索引进行查阅。  相似文献   

6.
Internet上的英文搜索引擎   总被引:8,自引:0,他引:8  
介绍了Internet上几个典型英搜索引擎的设计原理,并对它们的性能做了一定的测试和比较,并提出了改进思想。  相似文献   

7.
一种具有统一查询界面的Web搜索引擎   总被引:1,自引:0,他引:1  
1元搜索引擎背景 WWW目前已成为Internet上突破时间和空间的限制而获取信息的主要方式,人们通过搜索引擎来获取WWW资源日益普及。因为搜索引擎除能自动对WWW资源建立索引或进行主题分类以外,还能通过查询语法为用户返回匹配资源。 目前,Internet上有千余个搜索引擎,不同网站为满足用户的不同需求,都有自己的搜索引擎,人们熟悉的优秀搜索引擎有Yahoo!、Atavista、Lycos、Infoseek等。但事实说明,没有一个搜索引擎能够覆盖所有的WWW资源,这就很难满足用户查询信息时查全查准…  相似文献   

8.
Excite搜索引擎   总被引:2,自引:0,他引:2  
随着Web在Internet上的迅速发展,各种Web信息检索工具先后涌现,信息查询服务的数量和种类也不断增加,如搜索引擎、Web指南、黄页及白页数据库查询服务等。在大家所熟悉的搜索引擎中,Excite无疑是一个独具人性化和亲切感的搜索引擎。概况Excite检索引擎Web服务器的URL为:http://www.excite.com。其总部位于美国加州Redwood城的Excite公司(ExciteInc.),一直致力于自动超文本链接、主题分类和自动文摘的检索查询软件产品、服务及特性的开发,1995年10月推出的Excite搜索引擎是该公司最为著名的整套Web信息服务产品,主要提…  相似文献   

9.
一种新型的智能搜索引擎   总被引:9,自引:0,他引:9  
介绍一种针对特定领域的智能搜索引擎。它采用一种新型的概念背景网络来组织领域背景知识;然后在背景网上对领域概念进行概念扩展和相关性比较。与其他搜索引擎相比,该智能搜索引擎能对自然语言进行某种程度的语义理解;利用领域知识来提高搜索的查准率和查全率。  相似文献   

10.
本文介绍了Web上基于搜索引擎的元搜索引擎的原理,对两上主要元搜索引擎的性能作了一些测试和比较,并提出了相应的改进措施。  相似文献   

11.
智能化搜索引擎技术的研究进展   总被引:12,自引:0,他引:12  
阐述了传统信息获取的几种模型,分析比较它们之间的优劣,归纳总结了信息获取模型的层次框架.对智能化信息获取技术的研究进展和概况进行综述,并给出了若干值得研究的问题及相应的关键技术.  相似文献   

12.
Internet上有关元搜索引擎的研究与设计   总被引:1,自引:0,他引:1  
概述了Internet上一种新形式——元搜索引擎的概念、构成及分类,对元搜索引擎和一般的搜索引擎进行了比较,联系当前国内外元搜索引擎的现状,分析了其意义,提出了基于Agent的元搜索引擎的设计方案,指出了有自己独特的检索方式和处理方式,突破了传统搜索的局限性,并且该形式尚有许多重要问题亟待解决。  相似文献   

13.
基于信息类别的元搜索引擎设计   总被引:1,自引:0,他引:1  
随着搜索引擎技术的发展,元搜索引擎已经成为搜索引擎的一个重要的研究方向.在传统元搜索引擎中,每次查询项提交给元搜索引擎时,元搜索引擎会选择同样的成员搜索引擎、查询项预处理算法和查询结果融合算法.这种处理方法仅考虑到用户的查询项,而没有考虑到用户所需信息的类别.这篇论文介绍了一种基于信息类别的元搜索引擎,对于用户提交的相同查询  相似文献   

14.
元搜索引擎的现状与发展   总被引:7,自引:1,他引:7  
元搜索引擎利用现有的独立搜索引擎的查询性能,将搜索引擎看成一个整体,为用户提供一个统一的查询界面与返回结果。介绍了目前网络上比较著名和流行的一些元搜索引擎,对近几年来关于元搜索引擎的研究进行了分析总结,旨在为对元搜索引擎的进一步研究提供参考。  相似文献   

15.
在信息时代,面对日益庞大的信息资源,需要通过一种科学手段来获取自己需要的准确及时的信息,这种科学的手段就是检索,信息检索。信息检索就是只从任何文献集合中查出所需信息的活动、过程和方法。通过论述信息检索的工作原理和其在网络环境下的作用,对比分析了基于网络的信息检索几种类型的特点,对高速而有效的信息检索系统的核心技术搜索引擎技术进行了分析,指出随之带来的亟待解决的快速有效获取信息的问题和搜索引擎技术符合时代要求的发展方向。  相似文献   

16.
元搜索引擎是一站式搜索引擎,促进人们对网络信息资源的有效利用.通过元搜索引擎的概念、特点和工作原理介绍,对比独立搜索引擎,指出元搜索引擎的资料挖掘等不足,倾向网络搜索,专业搜索欠缺,指出元搜索引擎资料挖掘的发展方向.  相似文献   

17.
为了给元搜索引擎的开发者提供建设性意见和建议,以及给普通搜索用户提供使用选择上的指导,对比研究了20个典型的国外元搜索引擎的搜索特性,提出了一个好的元搜索引擎应具有的特性,包括应调用的独立搜索引擎情况、检索结果页面中应包含的信息元素、检索请求提交应支持的处理方式、个性化检索应设置的选项,以及应支持多语言检索等各个方面.  相似文献   

18.
大规模搜索引擎检索系统框架与实现要点   总被引:12,自引:0,他引:12       下载免费PDF全文
随着Web规模的不断扩大,搜索引擎正成为因特网上最常用的应用之一。本文以天网搜索为实例,分析了大规模通用型中文搜索引擎检索系统的设计与实现技术。围绕检索效率和检索效果两个方面,本文介绍天网检索系统的集成框架结构和分布式架构,并分析了索引创建和索引检索中的相关实现技术。  相似文献   

19.
搜索引擎检索系统质量评估   总被引:6,自引:0,他引:6  
搜索引擎检索系统的质量评估对传统信息检索系统评估带来了新的研究问题.利用Tiangwang搜索引擎查询日志,按类别构造评估查询集,用人工判别相关性的方法对3个搜索引擎进行了检索质量评估.实验用InfoMall系统提供的历史网页服务消除不同搜索引擎搜集系统收集网页集合的差异,得到如下结论:①评测员之间的差异很大,但评估实验结果保持稳定;②使用连续型的相关度评分以及对应的评估指标比二元相关度评分及指标具有更好的区分能力;③使用50左右规模的查询集合和DCG这样的连续型评估指标可以有效进行评估实验.  相似文献   

20.
Information retrieval has evolved from searches of references, to abstracts, to documents. Search on the Web involves search engines that promise to parse full-text and other files: audio, video, and multimedia. With the indexable Web at 320 million pages and growing, difficulties with locating relevant information have become apparent. The most prevalent means for information retrieval relies on syntax-based methods: keywords or strings of characters are presented to a search engine, and it returns all the matches in the available documents. This method is satisfactory and easy to implement, but it has some inherent limitations that make it unsuitable for many tasks. Instead of looking for syntactical patterns, the user often is interested in keyword meaning or the location of a particular word in a title or header. This paper describes some precise search approaches in the environmental domain that locate information according to syntactic criteria, augmented by the utilization of information in a certain context. The main emphasis of this paper lies in the treatment of structured knowledge, where essential aspects about the topic of interest are encoded not only by the individual items, but also by their relationships among each other. Examples for such structured knowledge are hypertext documents, diagrams, logical and chemical formulae. Benefits of this approach are enhanced precision and approximate search in an already focused, context-specific search engine for the environment: EnviroDaemon.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号