共查询到18条相似文献,搜索用时 386 毫秒
1.
Lucene是一个全文索引引擎工具包,具有访问索引效率高、支持多用户访问、跨平台等优点.把Lucene的索引与全文检索数据库的索引进行比较来介绍Lucene的索引原理及其结构组成,并分析通用的检索系统的组成.最后提出了通用的基于Lucene的全文检索系统的设计以及对实现的关键技术进行了探讨. 相似文献
2.
基于Lucene的搜索引擎在远程教育平台中的应用 总被引:1,自引:0,他引:1
一个好的搜索引擎可以使用户高效地搜索到自己需要的信息.Lucene是一个用Java写的全文索引工具包,访问索引速度快,支持多用户访问,可以跨平台使用.分析Lucene的索引原理,实现了一个基于Lucene的远程教育平台的应用. 相似文献
3.
基于Lucene的全文检索引擎研究与应用 总被引:3,自引:2,他引:3
快速有效地索引企业累积的大量的信息资源,是提供高质量检索服务的基础。Lucene是一个用Java写的全文索引引擎工具包,访问索引时间快,支持多用户访问、可以跨平台使用。文中研究了Luocne系统结构和数据流,分析了Lucene的索引文件格式,实现了一个基于Lucene文档检索的应用实例。 相似文献
4.
Lucene是一个用Java编写的全文搜索引擎工具包,支持多用户访问,访问索引速度快,可以跨平台使用.文章首先介绍了全文检索系统与全文检索引擎Lucene,以及Lucene的系统结构和实现机制,最后结合实际应用背景给出了全文检索系统的主要实现步骤. 相似文献
5.
基于Lucene全文检索引擎的应用研究 总被引:1,自引:0,他引:1
Lucene是一个强大的全文索引引擎工具包,它的全文检索技术是信息检索领域广泛使用的基本技术,具有访问索引时间快、多用户访问、跨平台使用的特点.介绍了一个高性能的全文检索引擎--Lucene开源系统,详细分析了Lucene的系统结构、全文索引机制,然后将其引入具体应用,给出了一个基于Lucene全文检索技术的具体实例. 相似文献
6.
LIANG Yong-lin 《数字社区&智能家居》2008,(20)
Lucene是一个用Java写的全文索引引擎工具包,访问索引时间快,支持多用户访问,可以跨平台使用。介绍了基于Java的全文检索引擎Lucene,包括下载与配置,以及基本概念与实现机制,然后将Lucene与传统数据库系统的输入输出机制与查询技术作了比较。 相似文献
7.
基于Lucene/Heritrix的垂直搜索引擎的研究与应用 总被引:2,自引:0,他引:2
Lucene是一个用Java写的全文索引引擎工具包,访问索引时间快,支持多用户访问,可以跨平台使用.Heritrix是一个由Java开发的、开源的Web网络爬虫,用户可以使用它从网络上抓取想要的资源.探讨了Lucene和Heritrix在构建垂直搜索引擎中的应用. 相似文献
8.
为了从这些海量信息中获取“有用的、满足用户需求的信息”,提出一个基于Hadoop和Lucene技术的分布式检索系统架构处理Web电子产品信息检索。利用Hadoop的Map和Reduce实现分布式索引文件的存储,通过Lucene检索技术实现索引文件的访问,从而提高信息检索的效率。并且针对Lucene_Hadoop架构存在粗粒度检索问题,提出了一种细粒度检索方法,减少了系统建立索引的时间。实验表明基于Hadoop和Lucene的分布式检索系统在Web电子产品信息中具有较高的检索性能。 相似文献
9.
Lucene2.0是一个高性能的、可扩展的、开源的全文检索工具库,它可以方便地融入到各种应用系统中实现全文索引和搜索功能:在搜索引擎中,Lucene是充当索引的建立工具和索引的查找工具的角色.文章详细分析了Lucene分析器、索引包、搜索包以及Lucene中评分排序、中文分词、索引优化等关键技术点,然后将其引入具体应用,给出了一个基于Lucene2.0的电子文献全文检索系统的实现、 相似文献
10.
11.
陈凤娇 《电脑与微电子技术》2011,(15):18-20
介绍Lucene的索引和排序技术,并对排序技术进行改进,利用Lucene开源全文本搜索技术框架建立全文检索系统,设计实现索引器、检索器、中文分析器等模块,完成一个基于Lucene的搜索引擎的应用。改进后的基于Lucene的全文检索系统能更好地支持中文及更准确地提供给用户所需要的信息。 相似文献
12.
介绍Lucene的索引和排序技术,并对排序技术进行改进,利用Lucene开源全文本搜索技术框架建立全文检索系统,设计实现索引器、检索器、中文分析器等模块,完成一个基于Lucene的搜索引擎的应用。改进后的基于Lucene的全文检索系统能更好地支持中文及更准确地提供给用户所需要的信息。 相似文献
13.
14.
索引技术是搜索引擎的核心技术之一,索引技术的好坏直接影响到搜索引擎的查准率以及对用户的响应速度。Lucene是一个优秀的全文检索引擎架构,采用高度优化的倒排索引结构并支持增量索引。但在实际应用Lucene时存在一个值得关注的问题:随着被索引文件的增多,索引时间成线性增长,导致建索引的过程会影响搜索体验;在搜索引擎应用中,当索引文件量达到一定等级时,搜索引擎就遇到性能瓶颈。在深入分析和研究Lucene索引机制的基础上,采用以内存为缓冲区建索引文件的分布式并行索引技术形成了一个可扩展的搜索引擎解决方案,极大地缓解了建索引给搜索带来的瓶颈问题。 相似文献
15.
基于Lucene的中文全文检索系统的研究与设计 总被引:4,自引:0,他引:4
提出了一种基于Lucene的中文全文检索系统模型.通过分析Lucene的系统结构,系统采用了基于统计的网页正文提取技术,并且加入了中文分词模块和索引文档预处理模块来提高检索系统的效率和精度.在检索结果的处理上,采用文本聚类的办法,使检索结果分类显示,提高了用户的查找的效率.实验数据表明,该系统在检索中文网页时,在效率,精度和结果处理等方面性能明显提高. 相似文献
16.
分析全文搜索引擎的基本结构及原理,并使用开源工具Heritrix作为搜索引擎的爬虫负责下载Web页面、HTMLParser抽取Web页面的内容、Lucene提供索引和搜索服务,采用B/S模式实现一个全文搜索引擎。 相似文献
17.
Lucene是一个纯Java实现的高性能、可扩展的全文信息检索工具库,可以很方便地把它融入到应用程序中来增加索引和搜索功能。该文分析了Lucene的索引机制,探讨了Heritrix的结构框架,最后结合实际实例对基于Lucene的全文检索的应用进行深入研究。 相似文献
18.
XU Lu-lei 《数字社区&智能家居》2008,(5)
在介绍了搜索引擎基本原理和构架的基础上,提出了一种整合Larbin、Lucene、ICATLAS等多种开源工具快速构建小型搜索引擎的实验方案。实验表明,该引擎能有效完成网页的采集、处理、索引和检索等工作。 相似文献