扫描版PDF转文本的方法
来源:互联网 发布:微信免签约接口源码 编辑:程序博客网 时间:2024/05/16 18:25
PDF转文本文件的最简单方法
有很多是用扫描仪扫进去然后做成的caj文件或pdf文件
这样就没法用选定文本的方式来复制、粘贴了。很郁闷!!
有没有办法将这些图片格式的文本转成真正的文本呢,当然有!
需要的软件就是鼎鼎大名的office 2003
1.用Adobe Reader 或者是CajViewer打开所要转的文件
2.工具栏里选文件->打印.一般安装了office 2003之后就安装一个虚拟打印机(Microsoft office Document imaging),然后选择这个虚拟打印机.选打印全部点确定
3.之后选择文件保存路径,这个文件是mdi格式的,打印完后Microsoft office Document imaging会自动打开你刚才保存的文件.
4.然后在工具栏里选择工具->将文本发送到Word
5.在这里需要Office的一个OCR(Optical Character Recognition光学字符识别)插件,如果在安装Office的时候没有安装,这时候需要用磁盘或镜像进行安装,提前备好Office安装程序哦
大功告成,但是OCR不可能达到100%准确,之后还需要对文档进行reivew及修改工作,但是这个工作量比你把PDF中左右文字一个个敲到文本文件里可是效率高得多。
如果有兴趣也可以自己写个OCR是识别程序,开源且支持中文的OCR库推荐Tesseract(C++),当然也可以使用更好用的Asprise-OCR(支提供JAVA接口),不过需要破解后使用,破解及使用方法可以google一下。
- 扫描版PDF转文本的方法
- 批量转文本编码的小工具
- 一个图片转文本的小工具
- 强大的SpannableStringBuilder,玩转文本特效
- DWORD类型ip地址转文本类型方法
- Excel日期转文本
- EXCEL转文本
- 语音转文本
- 比较好用的图片文字转文本工具
- 扫描版pdf的修改编辑
- 索骥馆-走向世界之《用美国小孩的方法学英文动词》扫描版[PDF]
- 扫描pdf转换成其他格式的方法
- 读取扫描版的Pdf文件 如何修改扫描版的pdf文件
- [沉思录(中英双语)·典藏本].(古罗马)奥勒留.扫描版.PDF 免费下载
- POI--word2003/2007转文本
- 索骥馆-思维训练之最佳记忆方法-王洪礼的奇象记忆思维技术与方法 》扫描版[PDF]
- 如何实现图片转文字的简单方法
- PDF电子书(扫描版)的目录书签批量导入
- 安装SVN客户端方法
- InitCommonControlsEx Function|MFC通用控件初始化
- Using OpenMP
- tomcat移植到weblogic上面乱码中文问题解决的方法
- MiniGUI 封闭曲线填充
- 扫描版PDF转文本的方法
- s1e3
- How to Create a Development Package ?
- sodu时提示:XXX is not in the sudoers file. This incident will be reported
- as3 关于加载透明图片
- 如何让采用递归的函数在自己想要的地方“停止”?
- 一名护士告诉你:临终病人最后悔的5件事
- SharePoint 几个重要且好玩的JS函数 一
- linux下eclipse的安装