.net如何读取PDF文档的内容
来源:互联网 发布:excel03版数据分析表 编辑:程序博客网 时间:2024/05/18 02:12
一、下载PDFBox
访问网址http://sourceforge.net/projects/pdfbox/,进入如图7-1所示的下载界面。
PDFBox是一个开源的Java PDF库,这个库允许你访问PDF文件的各项信息。
二、引用动态链接库
解压缩下载的PDFBox,找到其中的Bin目录,需要在项目中添加引用的dll文件有:
IKVM.GNU.Classpath.dll
PDFBox-0.7.3.dll
FontBox-0.1.0-dev.dll
IKVM.Runtime.dll
将以上4个文件引用到项目中,在文件中需要引入以下2个命名空间:
using org.pdfbox.pdmodel;
using org.pdfbox.util;
三、API的使用方法
请见以下示例:
using org.pdfbox.pdmodel;
using org.pdfbox.util;
public void pdf2txt(FileInfo file,FileInfo txtfile)
{
PDDocument doc = PDDocument.load(file.FullName);
PDFTextStripper pdfStripper = new PDFTextStripper();
string text = pdfStripper.getText(doc);
StreamWriter swPdfChange = new StreamWriter(txtfile.FullName, false, Encoding.GetEncoding("gb2312"));
swPdfChange.Write(text);
swPdfChange.Close();
}
- .net如何读取PDF文档的内容
- PDF格式文档的内容如何编辑
- 用iTextSharp读取PDF文档中文本内容的探索
- 编程读取文档Doc,Docx,Pdf的内容
- pdf文档内容如何修改
- 如何将pdf文档内容转为图片
- 如何将pdf文档内容转成图片
- php读取word\pdf等文档的内容,并将其保存到网页中
- 用iTextSharp读取PDF格式文档中的文本内容
- C#生成PDF文档,读取TXT文件内容
- java读取word,excel和pdf文档内容
- asp.net filestream 如何读取pdf文件
- 怎样编辑pdf文档的内容部分
- Java读取PDF文字内容的方法
- PDF文档的读取,vudroid(Android)
- ASP.NET读取Word文档转换为PDF文件的方法
- ASP.NET读取Word文档转换为PDF文件的方法
- JAVA中如何获得word,excel,pdf等文档的内容
- POJ 3427 Ecology tax
- MKMapView用法
- stdarg.h的介绍(转)
- eclipse @override 报错 解决
- E4X教程[5] - 全局 XML 对象
- .net如何读取PDF文档的内容
- 在web页面实现flash播放pdf,word文档等(asp.net c#+flash Paper+SWFTools)
- 在web页面实现flash播放pdf,word文档等(asp.net c#+flash Paper+SWFTools)
- 在web页面实现flash播放pdf,word文档等(asp.net c#+flash Paper+SWFTools)
- 5.Cario图形库-图形和填充
- web页面实现flash播放pdf,word文档等(asp.net c#+flash Paper+SWFTools)
- web页面实现flash播放pdf,word文档等(asp.net c#+flash Paper+SWFTools)
- Flex:MyReport报表引擎介绍
- web页面实现flash播放pdf,word文档等(asp.net c#+flash Paper+SWFTools)