首页 | 官方网站   微博 | 高级检索  
     

Lucene应用中Pdf文档文本数据提取方法研究
引用本文:杜德生,田小军.Lucene应用中Pdf文档文本数据提取方法研究[J].自动化技术与应用,2009,28(3):50-51.
作者姓名:杜德生  田小军
作者单位:哈尔滨理工大学,自动化学院,黑龙江,哈尔滨,150080
摘    要:基于Lucene的搜索已在各种应用系统中已经得到广泛应用,但是Lucene仅仅提供了全文文本搜索的函数库。本文研究了Pdf文档文本数据的提取方法,其优点在于能快速对Pdf文档文本数据进行提取,得到站内Pdf文档文本数据。

关 键 词:Lucene  文本搜索  Pdf文档

Lucene for the Pdf Document Retrieval
DU De-sheng,TIAN Xiao-jun.Lucene for the Pdf Document Retrieval[J].Techniques of Automation and Applications,2009,28(3):50-51.
Authors:DU De-sheng  TIAN Xiao-jun
Affiliation:( Automatic College, Harbin University of Science and Technology, Harbin 150080 China )
Abstract:Lucene is an open source full-text retrieval engine and it is a basic tcchnology used widely in the information retrieval field. This paper discusses the Pdf document search for the Chinees full-tex trieval.
Keywords:Lucene
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号