首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 390 毫秒
1.
基于Lucene.Net的分布式全文检索系统   总被引:1,自引:0,他引:1  
随着互联网的发展,现代信息量急剧增加,人们对于信息的检索要求越来越高,一个好的检索系统必须具有较快的检索速度和较高的查准率.针对海量文本数据提出一种基于Lucene.Net全文检索引擎构建的分布式全文检索系统,使用.NET Remoting实现分布式的全文索引与全文检索,具有较好的扩展性和很快的索引与检索速度,并成功地将该技术应用于军队某部信息管理系统,取得了很好的效果.  相似文献   

2.
海量异构文档的快速检索和细粒度、多维度控制信息的存取是面向行业应用的文档管理系统中的关键。本文利用Lucene.net开源全文检索引擎和Oracle数据库,设计并实现了一个基于B/S架构,能够保存文档密级、分类等多种信息文档组织与检索系统,实现了对海量异构文档数据的快速检索和存取,并实现了文档数据的逐文档按角色分等级权限管理。  相似文献   

3.
海量异构文档的快速检索和精细颗粒度权限控制的文档存取是面向行业应用的文档管理系统中的关键。在Oracle Text全文检索技术的基础上,基于B/S架构设计并实现了一个密级文档组织与检索系统,实现了对海量异构文档数据的快速检索,并实现了文档数据的逐文档按角色分等级权限管理。  相似文献   

4.
Isearch是由美国国家自然科学基金投资,网络信息发掘与检索中心研制开发的一个全文检索引擎,也是最早实现诸如XML文档等基于标记的检索的搜索引擎之一。与一般XML检索引擎的设计相比,Isearch由于结合采用了全文检索引擎的一些技术,有效地控制了索引文件的大小,并保持了较高的检索效率。Isearch系统机制的研究,对于深入了解XML文档检索原理,尤其是拓展XML文档检索系统的功能具有重要意义。  相似文献   

5.
全文检索技术是从海量信息里精确查找所需信息的最有效手段,它的应用提高了海量文档的检索效率。该文阐述了SQLServer 2000全文检索技术在无纸化考试子系统中的具体应用,该系统采用了B/S结构,应用业务层采用C#语言开发,用户界面层采用ASP.NET开发。  相似文献   

6.
为了从这些海量信息中获取“有用的、满足用户需求的信息”,提出一个基于Hadoop和Lucene技术的分布式检索系统架构处理Web电子产品信息检索。利用Hadoop的Map和Reduce实现分布式索引文件的存储,通过Lucene检索技术实现索引文件的访问,从而提高信息检索的效率。并且针对Lucene_Hadoop架构存在粗粒度检索问题,提出了一种细粒度检索方法,减少了系统建立索引的时间。实验表明基于Hadoop和Lucene的分布式检索系统在Web电子产品信息中具有较高的检索性能。  相似文献   

7.
针对传统软件技术设计的植物图像检索系统中存在无法实现智能检索、植物图像数量增长慢、检索系统难以扩容,以及当植物图像数量达到百万级以上时检索效率低和检索请求高并发时植物图像加载慢等问题,提出利用百度AI技术、ImageSharp图像分割技术和CV2颜色识别技术实现植物图像的智能检索。利用FastDFS技术实现检索系统的动态扩容、负载均衡和植物图像的快速加载,利用Solr搜索引擎技术提高海量植物图像的检索效率,利用Python爬虫技术不断丰富检索系统的植物图像从而实现检索系统的可持续化发展。实验结果表明,通过上述技术能够构建一个面向海量植物图像的智能检索系统。  相似文献   

8.
针对海量文本信息的数据挖掘应用中,全文检索是一个重要功能。Oracle作为大型数据库管理系统,对全文检索功能的实现提供了强大的支持。从满足民航现实业务的需求出发,详细描述了应用Oracle的全文检索技术,实现在海量的数据信息中查找特定内容的功能,具有较强的实用价值。  相似文献   

9.
针对海量涉密隐私数据高效安全检索的需求,提出了一种基于密文的全文检索系统——Mimir.Mimir基于B+树构建了一种安全密文全文索引结构,Mimir检索过程完全在密文环境下进行,保证了系统的安全性和存储信息的私密性.与传统的全文检索系统相比,Mimir密文索引中没有存储索引词的位置信息和词频信息,可以有效地抵御已知明文攻击、选择明文攻击和词频统计攻击.对Mimir密文全文检索系统进行了性能测试,实验结果数据表明,Mimir密文全文检索系统在确保高安全性的同时,也具有很好的检索时间和存储空间性能.  相似文献   

10.
音视频资源中包含的可检索信息少,而且通常访问粒度大,不利于对其检索和使用。基于Lucene全文搜索引擎构建了一个音视频资源检索系统。系统通过多种方式为音视频注入语义文字信息,标注音视频片段,在此基础上使用Lucene实现全文检索,同时结合数据库检索和增强的语义检索提高检索的效率。实验显示,检索的召回率、准确率和用户满意度都比较高。  相似文献   

11.
包煊  陈建华  郭昕  汪志华 《计算机工程》2002,28(10):238-240,247
介绍了一个剪报资料处理和检索系统EPCutter(Electronic Press Cutter),它包括3个子系统:剪报资料处理子系统,网上智能代理子系统和全文数据库检索子系统,网上智能代理子系统利用数据挖掘技术和智能自主代理技术,自动从Web上挖掘出用户感兴趣的信息,全文数据库采用了字索引和词索引相结合的索引检索方法,从而大大提高了检索速度,查全率,查准率,此外还提出了一个统计模型,可对剪报来源作出评价以辅助用户决策。  相似文献   

12.
Given the ever-increasing scale and diversity of information and applications on the Internet, improving the technology of information retrieval is an urgent research objective. Retrieved information is either semi-structured or unstructured in format and its sources are extremely heterogeneous. In consequence, the task of efficiently gathering and extracting information from documents can be both difficult and tedious. Given this variety of sources and formats, many choose to use mediator/wrapper architecture (Y. Papakonstantinou, A. Gupta, H. Garcia-Molina, J. Ullman, A Query Translation Scheme for Rapid Implementation of Wrappers, International Conference on Deductive and Object-Oriented Databases, Singapore, 1995), but its use demands a fast means of generating efficient wrappers.In this paper, we present a design for an automatic eXtensible Markup Language (XML)-based framework with which to generate wrappers rapidly. Wrappers created with this framework support a unified interface for a meta-search information retrieval system based on the Internet Search Service using the Common Object Request Broker Architecture (CORBA) standard. Greatly advantaged by the compatibility of CORBA and XML, a user can quickly and easily develop information-gathering applications, such as a meta-search engine or any other information source retrieval method. The two main things our design provides are a method of wrapper generation that is fast, simple, and efficient, and a wrapper generator that is CORBA and XML-compliant and that supports a unified interface.  相似文献   

13.
韩升  刘广志 《微机发展》2006,16(3):208-210
全文检索的应用导致了信息检索领域的一场革命,是文档数据库研发的核心。在一个全文检索系统中,全文索引数据库的建立是系统的基础,其设计结构直接影响到全文检索引擎的检索算法以及系统最终的检索效率。文中主要介绍全文检索系统中索引库结构设计、文本标引技术等数据预处理技术,以及全文检索系统索引数据库的数据处理流程。最后,在此基础上研究了全文检索系统索引库索引生成算法,给出了单个文档和批处理两种情况下的索引库索引生成算法。  相似文献   

14.
汉字全文检索的实现与探讨   总被引:4,自引:0,他引:4  
文中介绍了一个利用大型数据库管理系统结合文件系统来完成汉字全文检索的实现方案,之后引入语义网,探讨了检索词的划分和扩检问题,最后,对目前汉字全文检索方面仍存在的一些问题进行了探讨。  相似文献   

15.
Lucene在数据库全文检索中的性能研究   总被引:2,自引:0,他引:2  
通过Lucene API实现对MYSQL数据库的全文检索,并将Lucene全文检索的性能和查全率同数据库全文检索和Like子句检索作对比.通过对比发现Lucene全文检索在性能上接近数据库全文检索,检索耗时约为Like子句检索的1/5.在对中文检索方面能达到77.2%的查全率,大大高于数据库全文检索.因此对于数据量较大的MYSQL数据库,Lucene全文检索将是一个很好的选择.  相似文献   

16.
基于Java/CORBA架构的分布式综合信息检索平台   总被引:5,自引:0,他引:5  
介绍了一个分布式检索系统的设计与实现,该系统基于Object Web理论,采用Java/CORBA架构。系统包含接口定义、服务器端服务对象、客户端查询对象等几个部分。  相似文献   

17.
介绍Lucene的索引和排序技术,并对排序技术进行改进,利用Lucene开源全文本搜索技术框架建立全文检索系统,设计实现索引器、检索器、中文分析器等模块,完成一个基于Lucene的搜索引擎的应用。改进后的基于Lucene的全文检索系统能更好地支持中文及更准确地提供给用户所需要的信息。  相似文献   

18.
This paper presents an infrastructure and a prototype system for a manufacturing information system, which is distributed its nature and is able to store, index, manage, retrieve and present business data, inventory data, and manufacturing processes data. The system works with all kinds of information, such as continuous (i.e., stream oriented) data, production (e.g., decision support) data, legacy data, and multimedia data (say, drawings, pictures, audio signals, voice annotations, and video streams). A key criterion is support for content-based information retrieval across all application areas. The main objective is to provide support for automated information transactions. The prototype of our architecture uses JAVA, STEP (ISO 10303) standard, the Internet, and CORBA. A fully functional system, called Perspective, for retrieval of part and manufacturing process has been designed and implemented in a distributed environment. Among other capabilities, the system can retrieve a set of parts or manufacturing processes based on similarity to some desired criteria.  相似文献   

19.
采用合作缓存技术的并行全文检索   总被引:8,自引:0,他引:8  
全文检索是一种资源消耗型操作,并行全文检索可以缩短全文检索的响应时间,以前的并行检索研究主要集中在磁盘资源和CPU资源的优化利用方面,本文提出一种采用合作缓存技术的并行全文检索模型,以优化对内存资源的利用,并对该模型进行了分析和评价,说明该模型可以有效地提高检索性能。  相似文献   

20.
Web智能信息检索体系结构的研究   总被引:3,自引:0,他引:3  
利用XML建立了基于领域模型的Web信息集成系统 ,对Web信息进行了分割、组织和管理 ,并参考公共对象请求代理结构CORBA ,集成XML和移动Agent技术的优势 ,构造了一个Web智能信息检索体系结构。它不仅适合Web发展的需要 ,同时为用户获取网络信息提供了一种有效的方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号