首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
基于校园网的中文搜索引擎系统   总被引:2,自引:0,他引:2  
在存有海量信息的互联网上高效地搜索信息,搜索引擎是必不可少的.介绍了一个基于校园网的中文搜索引擎的设计与实现.  相似文献   

2.
随着互联网的快速发展,其信息量和相关服务也随之快速增长.如何从海量的信息中快速、准确地抓取所需要的信息变得越来越重要,因此负责互联网信息收集工作的网络爬虫将面临着巨大的机遇和挑战.目前国内外一些大型搜索引擎只给用户提供不可制定的搜索服务,而单机的网络爬虫又难当重任,因此可定制性强、信息采集速度快和规模大的分布式网络爬虫便应运而生.通过对原有Scrapy框架的学习和研究,将Scrapy和Redis结合改进原有的爬虫框架,设计并实现了一个基于Scrapy框架下的分布式网络爬虫系统,然后将从安居客、58同城、搜房等网站抓取的二手房信息存入MongoDB中,便于对数据进行进一步的处理和分析.结果表明基于Scrapy框架下的分布式网络爬虫系统同单机网络爬虫系统相比效率更高且更稳定.  相似文献   

3.
Web网上大量的异构、非结构化的数据使人们难以有效地发现自己所需信息. 通过利用元数据和本体语义特点,借助Web服务技术,提出构建元数据登记库MDR和本体管理系统OMS,在分布式闭包生成基础上进行推理,实现基于本体表示语言RDF特性的Web数据搜索引擎SBWSE,达到分布异构环境下高效发现信息的目的,解决了基于关键词的搜索引擎所表现的查全率和查准率不佳问题.  相似文献   

4.
随着互联网发展,企业随之转型,积极开展基于互联网的业务.传统业务系统架构基于集中式数据管理系统如MySQL之上,在封闭使用状态向开放使用状态转换的过程中,逐渐在可用性上暴露出弊端,故而不能很好地支持业务拓展规模化、分布式处理的要求.网络业务的开展对工单系统提出了在支持大数据、高并发、高冲突、高可用下保证处理高效性的新需求.在深入分析当前业务特征的基础上,利用分布式数据库Cedar,基于Netty通信框架,以海尔的工单业务为实例,设计并实现了支持工单存储、派单以及工程师抢单业务的高效、可扩展工单管理系统,详述了系统的可靠性和可扩展实现.经实验表明,该工单系统在保证高吞吐和低延迟的同时具有良好的可扩展性和可用性.  相似文献   

5.
互联网是知识和信息的海洋,但许多朋友甚至许多经常使用网络的朋友,都不知该如何快速而准确地利用搜索引擎来获取网络上的信息。本文试从搜索引擎的基础知识,使用方法,高效使用及特殊使用方法等几方面,对如何利用搜索引擎获取网络信息做了阐述。  相似文献   

6.
随着互联网上信息数量的激增,信息搜索技术面临着越来越大的挑战.传统的搜索引擎很难满足用户个性化的需求,因此将人工智能技术的研究成果引入到搜索引擎之中便成了不可避免的一种趋势.在传统搜索引擎的基础上,笔者提出了一种基于多Agent协作的智能搜索引擎模型,并将多种智能技术或算法引入到该引擎的研究之中,从而得到一个符合个性要求的高效的证券专业领域搜索引擎系统.将该系统运用到其他专业领域,同样可以取得很好的查询效果.  相似文献   

7.
智能元搜索引擎的研究   总被引:10,自引:0,他引:10  
皮鹏  张国印 《应用科技》2001,28(8):24-26
介绍了一种基于Internet的信息检索系统:智能元搜索引擎。该系统采用分布式Agent技术,以词典作为信息匹配和交互的媒体,能够很好地对用户的兴趣进行自适应学习,对用户提供个性化的信息检索服务。  相似文献   

8.
提出了一种应用于流程工业的分布式海量报警管理系统,利用Hadoop平台的分布式可扩展特性实现了海量报警数据的可靠存储和高效处理.在数据存储层,通过合理的列式存储结构设计,实现了海量报警数据的分布式集群存储;在信息查询层,实现了类MapReduce过程的报警管理系统分布式并行查询模型;在功能应用层,根据业务需求实现了基本的报警管理功能模块.测试结果表明,面对海量报警数据的应用场景,基于Hadoop平台的分布式海量报警管理系统比传统报警管理系统具有更为出色的性能.  相似文献   

9.
利用信息检索、本体和个性化搜索等相关知识,构建一种基于本体的个性化搜索引擎模型PSMBO.该模型由用户界面、查询请求处理模块、检索模块、查询结果处理模块、兴趣学习模块以及用户兴趣知识库和本体知识库七个部分组成.该模型在一定程度上提高了搜索引擎在查准率和查全率方面的性能.  相似文献   

10.
分布式仿真平台是当前仿真计算领域的重要技术.本文介绍并分析了一种分布式仿真平台的信息传输协议,该协议由数据包封装格式,以及数据的收发数据流程组成,具有交互信息高效、反应迅速的特点,对分布式仿真系统有着指导作用.  相似文献   

11.
多元搜索引擎能够有效利用多个搜索引擎的搜索与集成资源能力.文章首先分析了现有多元搜索引擎的局限性,然后提出并发多元搜索引擎的改进方案,阐述了并发多元搜索引擎的结构、关键技术,以及在外文电子资源统一检索平台系统中的应用.该引擎实现了高效的查询请求分发与结果处理,具有较好的并发处理能力和效率.  相似文献   

12.
互联网信息的快速增长,给搜索引擎的信息采集系统带来更大的挑战.将优化的主动哈希策略和多级缓存策略应用到分布式信息采集系统的域名解析过程中,使得无需为DNS服务器进行额外设置就能极大提高域名解析的性能,在一定程度上提高了分布式信息采集系统的性能.  相似文献   

13.
现代企业品牌产品在搜索引擎中的传播   总被引:1,自引:0,他引:1  
倪楠 《安徽科技》2009,(8):31-32
一、搜索引擎营销简介 1.什么是搜索引擎营销 搜索引擎营销就是根据用户使用搜索引擎的方式,利用用户检索的机会尽可能地将企业的产品营销信息传递给目标用户,这是计算机网络营销的一种新形式。也就是说,企业有效地利用这种被用户检索的机会实现企业产品信息的传递,这就是搜索引擎营销。搜索引擎营销的基本思想是让用户发现信息,并通过点击进入网站或网页进一步了解其所需要的信息.  相似文献   

14.
搜索引擎是互联网最广泛的应用之一,对搜索引擎优化策略进行评价,对企业开展该项工作有着重要的指导意义。从信息生态的角度展开该领域的研究,有助于判断网站搜索引擎优化的稳定性和持续发展能力。该研究从信息生态的视角,利用层次分析法,构建了搜索引擎优化策略的评价指标体系,并采用模糊综合评价的方法,对华为在线商城进行了实证研究。从研究结果来看,该文构建的评价指标体系具有较强的可操作性和较高的实践应用价值,能够较好地判断网站搜索引擎优化的生态性,也为信息生态系统的研究提供了新的视角。  相似文献   

15.
本文提出一个新的Web搜索引擎框架GSE,并提出了一个适应Web信息获得与处理的语言WIRPL,通过WIRPL可以将多个Web搜索引擎结合起来,为用户提供一个一致高效准确的Web搜索引擎。  相似文献   

16.
针对目前搜索引擎返回的信息量过大且缺乏语义关联等问题,提出了一种云计算环境下的可视化探索式搜索引擎模型.该模型通过对元搜索引擎返回的原始信息在云计算环境下语义相似度的计算和语义链的构建,采用探索式搜索方法为用户获取个性化的结果.与传统搜索引擎相比,其结果更加直观地表现了目标信息及其之间丰富的语义关系,该方法使用户能够更为自然而有效地在海量的信息中发现更符合其需求的目标.作为实验模型,还需要更多的元搜索引擎的支持,以及进一步计算优化语义相似度的算法,才能使该模型真正实用化.本研究为云计算环境下构建新一代个性化智能搜索引擎提供了理论和实践上的参考.  相似文献   

17.
近年来,互联网的发展和普及,各类科技信息网及其他网络的建设,为科技工作者提供了便捷的信息流通途径。目前国内外的搜索引擎从最初的主题指南发展到独立型搜索引擎、混合式搜索引擎、元引擎及分布式搜索引擎等,其性能日趋完善,如常用的YAHOO、INFOSEEK、ALTAVISTA、SOHU,NETEASE等。  相似文献   

18.
一种适合于专题式元搜索引擎的信息检索策略   总被引:1,自引:0,他引:1  
现有的元搜索引擎技术是基于关键词的信息检索,在查找某一专业知识时,简单的关键词组合不能真实地反映用户的检索意图,导致在检索中大量无关的信息被返回,专题式的元搜索引擎较好地解决了这一问题.本文通过对现有的元搜索引擎技术、领域知识库等研究,提出了一种适合于专题式元搜索引擎的信息检索策略,提高了检索的效率与精度.本文着重介绍了该检索策略的核心思想及其关键技术.  相似文献   

19.
利用用户指定的关键字和搜索引擎生成URL种子,通过分布式网络爬虫抽取符合用户需求的网页作为研究所用的语料.实验结果表明:分布式网络爬虫可以较好地解决在短时间内抽取大量语料的需求.  相似文献   

20.
从技术构架、业务构架和数据库设计三方面进行研究,得出基于Smarty架构、采用MVC模式、以MYSQL为数据库开发平台的地情数据库系统,不仅较好地保证系统稳定、快速、高效的运行,也通过数据库的管理实现了地情信息传播的目的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号