共查询到19条相似文献,搜索用时 78 毫秒
1.
2.
PDF文件链接信息提取与修改 总被引:2,自引:0,他引:2
主要介绍了航空规章采用PDF文件格式,使用了书签、链接功能;利用AdobeAcrobat提供的编程接口编写Plug-in插件,实现了文件内和文件间的链接信息自动生成技术。 相似文献
3.
用APPRP突破PDF文件的限制 总被引:1,自引:0,他引:1
提起PDF相信大家都不会感到陌生,由Adobe公司推出的这种文件格式已经成为电子出版物和网络文档交流的一个最重要的标准。制作成PDF文件的多媒体出版物具有功能强大、体积小等优点,而且Adobe免费提供AcrobatReader软件供大家阅读PDF文件,保证同一个文件在所有平台上都能得到相同的效果。但是,很多出版者往往在PDF文件上附加各种限制,最常见的就是不允许读者复制、打印、修改文档中的内容。这虽然是出于保护版权的考虑,但的确给我们造成很大的不便。然而,通过使用某些破解软件,我们还是有可能突破这些限制。AdvancedPDFPassw… 相似文献
4.
PDF文件阅读器 总被引:1,自引:0,他引:1
骆遥 《电脑编程技巧与维护》2007,(7):32-37
通过一个PDF文档阅读器Free PDF Reader的开发实例,讨论了使用:Foxit Reader SDK(ActiveX)的具体编程方法,实现了PDF格式电子文档的显示功能,并通过对真彩工具条和箭头下拉按钮的编程,获得了与商业PDF 阅读软件Foxit Reader 较为一致的外观效果和软件功能. 相似文献
5.
目前许多信息安全产品需要根据用户权限控制其对相应文档的打印、修改、保存等子菜单操作。针对目前广泛使用的PDF文件,提出利用DDE(Dynamic Data Exchange)和Plug-in联合控制用户操作PDF文件的技术。同时提出将DDE程序生成DLL文件并引入用户权限的方法,再使用DLL钩挂技术,就可达到根据用户权限动态控制其对当前文件操作的目的。实践证明,这种方法可以很好地控制用户对PDF文件的相关操作。 相似文献
6.
随着办公自动化的普及,PDF文件以其方便阅读、打印和易于进行安全控制等特点受到广泛应用。但它也有漏洞,稍不留神也可能将重要机密文件泄漏出去,这该怎么办? 相似文献
7.
在常见的电子图书里面,其实不外乎微软的帮助(Help)文件、PDF文件、超星等专用的软件……而其中的PDF文件就是最为普遍,只在各大软/硬件的官方网站上去看一下,相信PDF格式的说明书一定是你见得最多的了。 相似文献
8.
新推出的 Adobe Acrobat 5.0改善了旧有版本的弊处,采纳了旧有用者的意见,以全新的面貌及各种新增的功能推出新版,不但大大方便了网路的传送,也使到 PDF 格式文件的制作更为简单易用。 相似文献
9.
10.
当我使用Adobe Reader 6来打开PDF文件时。总是要等很长时间。实在让人心焦。有什么方法可以让Adobe Reader 6打开得更快速吗? 相似文献
11.
PDF文件信息的抽取与分析 总被引:5,自引:0,他引:5
PDF文件网络信息抽取的重要资源。通过对PDF文件结构的分析,针对最流行的线性PDF文件,在论述如何从源代码中取出正文内容字符串流并进行解码的基础上,对从解码后的字符串流中提取出文本及其相关的字体、字号和换行等文本信息进行了详细的讨论。这将有助于根据需要进一步抽取PDF文件信息。 相似文献
12.
数字图书馆中信息采集子系统的设计与实现 总被引:1,自引:0,他引:1
电子文档的信息提取是建立数字图书馆的基础。论文主要介绍一个数字图书馆的信息采集子系统。它以PDF文件为提取对象,由全自动化录入和半自动录入两部分构成。全自动录入融合了基于规则和自动机两种提取方法的优点,具有速度快、准确率高等特点;半自动录入采用在AdobeAcrobat内部加入plug-in(插件)的方法为用户提供友好的使用界面,使用户可以方便地进行手工录入。 相似文献
13.
标签PDF文档通过内部标签描述文档逻辑结构信息,并建立了文档逻辑结构与内容之间的联系机制,因而较传统PDF文档有更好的可编辑性与交互性.然而PDF标准只提供了一些基本的文档逻辑结构标签,用于描述文档中的段落与图表等排版信息.而在科技文档中,常遇到公式,化学式等复杂的文档对象.为了在PDF中描述这些对象,对标签PDF文档结构作了研究,阐述了如何在标签PDF文档中结构化地表示科技文档对象,并用plug-in编程接口做了实现. 相似文献
14.
15.
PDF文件中可识别图像的提取 总被引:3,自引:3,他引:0
PDF(portable documentformat)文件是用于电子文档分发的理想格式,是全球电子文档分发的开放式标准.从PDF文件中提取可供识别的图像,有利于图像识别和信息处理.详细介绍了一种从PDF文件中提取可识别图像的方案. 相似文献
16.
为有效提取PDF(portable document format)文件中的文字、图片、图形信息,提出了包含文件预处理、显示预处理、功能扩展、显示4个单元的PDF阅读器的实现模型.基于PDF文件结构特点,提出了忽略次要信息定位关键位置的解析思路.在此基础上,针对FlatcDecode、DCTDecode和CCITTFFaxDecode这3种过滤器处理的数据流,给出了详细的解决方案,然后对PDF页面内容进行两次解析,设计相应的文字图形等数据结构保存结果,最后对数据利用和功能扩展进行了讨论.通过实验结果表明,该模型能较好地实现PDF信息提取和显示,有利于PDF在中文信息处理领域中的进一步开发利用. 相似文献
17.
Wen Hu Dat T. Huynh Saeid Hosseini Jiaheng Lu Xiaofang Zhou 《International Journal of Software and Informatics》2012,6(4):495-522
Microblogging(e.g. Twitter, http://twitter.com), as a new form of online communication in which users talk about their daily lives, publish opinions or share information by short posts, has become one of the most popular social networking services today, which makes it potentially a large information base attracting increasing attention of researchers in the field of knowledge discovery and data mining. In this paper, we conduct a survey about existing research on information extraction from microblogging services and their applications, and then address some promising future works. We specifically analyze three types of information: personal, social and travel information. 相似文献
18.
19.
为了对学术动态、热点及学术发展趋势进行研究,需要对学术研究论文进行数据挖掘研究。首先需要从海量的学术论文中提取有兴趣的信息。针对目前学术论文大多采用PDF格式的现状,重点研究了PDF文件的格式以及对PDF格式操作的各种技术,采用开源函数库PDFBox对PDF格式的学术论文按照规则进行信息的提取,提取的信息主要包括学术论文的标题、作者、单位、关键词、发表时间、摘要等信息。最后对提取信息的正确率进行了统计,有助于针对学术研究的大数据研究。 相似文献