C#读取PDF ——PDFBox使用
来源:互联网 发布:centos 复制文件 编辑:程序博客网 时间:2024/05/16 17:30
一、下载PDFBox
访问网址http://sourceforge.net/projects/pdfbox/(这个绝对是个好网站)
二、引用动态链接库
解压缩下载的PDFBox,找到其中的Bin目录,需要在项目中添加引用的dll文件有:
IKVM.GNU.Classpath.dll
PDFBox-0.7.3.dll
FontBox-0.1.0-dev.dll
IKVM.Runtime.dll
将以上4个文件引用到项目中,在文件中需要引入以下2个命名空间:
using org.pdfbox.pdmodel;
using org.pdfbox.util;
三、API的使用方法
using System.IO;
using System.Text;
using org.pdfbox.pdmodel;
using org.pdfbox.util;
namespace PDFReader
{
class Program
{
public static void pdf2txt(FileInfo pdffile, FileInfo txtfile)
{
PDDocument doc = PDDocument.load(pdffile.FullName);
PDFTextStripper pdfStripper = new PDFTextStripper();
string text = pdfStripper.getText(doc);
StreamWriter swPdfChange = new StreamWriter(txtfile.FullName, false, Encoding.GetEncoding("gb2312"));
swPdfChange.Write(text);
swPdfChange.Close();
}
static void Main(string[] args)
{
pdf2txt(new FileInfo(@"C:/Users/Susan/Desktop/完整稿__匆匆那年_九夜茴.pdf"), new FileInfo(@"C:/Users/Susan/Desktop/完整稿__匆匆那年_九夜茴.txt"));
}
}
}
- C#读取PDF ——PDFBox使用
- C#读取PDF ——PDFBox使用
- .net C#读取PDF ——PDFBox使用下载
- C# PDFbox读取PDF内容
- 使用PDFBox读取pdf文件
- pdf读取(PDFBox)
- Java 使用 pdfbox 读取 PDF文件中的文本
- pdfbox读取pdf到控制台
- JAVA PDFBOX 读取PDF表格
- java 用pdfbox读取pdf
- C#操作PDF文档--PDFBox读取pdf文档,O2S.Components.PDFRender4NET生成缩略图
- 使用PDFBox解析PDF文档
- 使用PDFBox解析pdf文件
- 使用PDFBox处理PDF文档
- 使用PDFBox处理PDF文档
- 使用PDFBox处理PDF文档
- 使用PDFBox处理PDF文档
- 使用PDFBox解析PDF内容
- python脚本检测linux进程是否运行
- 14. 59. 5. 设置表格里的值 Set table value
- 贴图时防止闪烁的双缓冲技术
- 从疯狂的程序员摘取的内容
- 附加数据库失败,操作系统错误 5:"5(拒绝访问。)"的解决办法
- C#读取PDF ——PDFBox使用
- HashMap和Hashtable的区别
- C# Winform 中webBrowser显示html内容时禁止错误提示的方法
- 内存对齐2(比较清楚的讲解)——重要
- DEP是数据交换协议的意思
- Windows无损分区
- 关于刷新重复提交问题的解决方案
- 负数的二进制表示与转换
- Qt4之消息对话框