从PDF文件提取文本--pdflib TET库
来源:互联网 发布:4k网络机顶盒排行榜 编辑:程序博客网 时间:2024/06/05 21:03
首先说明一点就是,使用的是pdflib TET库,并不是pdflib库,我在网上看到的人家都说是用pdflib,是不对的。pdflib只能生成pdf文件。不能读取,读取要用TET库。这里使用的是试用版本。
1、从官网http://www.pdflib.com/download/tet/下载c++支持安装包:
官网有说明:
PDFlib TET can be evaluated without a license, but will only process PDF documents with up to 10 pages and 1 MB size unless a valid license key is applied.
2、安装,我的安装路径是:C:\Program Files\PDFlib\TET 4.1 32-bit
3、在C:\Program Files\PDFlib\TET 4.1 32-bit\bind\cpp下面就有一个cpp的实例
4、完全可以用他的代码做一个vs工程,拷贝下面相应的一些头文件、实现文件和库文件,就可以自己做一个工程了:
5、最后用vs做一个控制台工程就是这样的,记得在项目属性里面的linker的input里面补上相应的链接库:
6、指定一个input的pdf文件,再指定一个输出的txt文档,就可以执行生成的程序文件了。
- 从PDF文件提取文本--pdflib TET库
- PHP中使用PDFlib TET提取PDF中的文本
- 利用PDFLIB开发库生成PDF文件
- 利用PDFLIB开发库生成PDF文件
- libharu和pdflib 两种写pdf库文件使用心得
- libharu和pdflib 两种写pdf库文件使用心得
- 提取PDF文件中的文本信息
- win32,使用PDFlib生成PDF文件
- 如何从PDF文件中提取矢量图
- VC6.0 实现 从PDF提取文本内容
- CAJViewer 提取pdf 文本
- CAJViewer 提取pdf 文本
- 利用PDFBox提取pdf文件文本内容的分析
- 提取pdf文件文本:pdfparser与xpdf具体操作
- 提取pdf文件文本:pdfparser与xpdf具体操作
- 基于labwindows 应用PDFlib自动生成PDF文件
- 如何使用免费PDF第三方插件从PDF文档中提取文本和图片
- 使用PDFlib生成pdf
- tomcat连接池的配置
- linux设备模型之sysfs使用
- 优化 布局层次结构
- 舌尖上的职场(四)我正忙。。。
- 你可能不知道的那些.Net大型项目、大型网站的案例……
- 从PDF文件提取文本--pdflib TET库
- mongodb分布式之数据复制
- 华为内部面试题库---(17)
- 华为内部面试题库---(18)
- Linux system program-目录操作
- aspx+rdlc实现报表功能
- wifi android 子系统架构
- Linux system program-网络
- 华为内部面试题库---(19)