猫儿PDF-Word格式转换经验谈

来源:互联网 发布:网络歌曲大全2017视频 编辑:程序博客网 时间:2024/06/05 05:50

猫儿我最近工作遇到了万恶的格式转换问题PDF-Word。众位看官抢着说“这不是很简单嘛?”“你就用XX软件就可以了嘛!”事实果真如此么?今天准备了10款软件和1份PDF文档进行测评。

 

1.ABBYY FineReader11

一个知名的俄罗斯ORC软件,拥有高超的识别技术。

OCR (Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。——百度百科

好我们下面就用ABBYY进行识别~

也许是安装的问题,使用ABBYY任务页中的PDF-Word并无任何输出。只好使用另存为试试。识别效果如下:(左:PDF原件;右:识别生成件,下同)


发现生成后的字体有些奇怪有木有!不过只要换换字体,对不能识别的部分稍做编辑还是很好用的。

再来看看ABBYY转换扫描图像件的表现:


非常完美有木有!只需换字体,轻松可编辑。

综合打分:★★★★★

 

2.Adobe Acrobat XI Pro 

提起Adobe公司详细你一定不会陌生,Acrobat就是该公司旗下的重要PDF处理软件。因为完全激活的步骤太繁琐,在此只装了试用版,转换效果如下:


可以看出识别率与ABBYY不分伯仲甚至略好于ABBYY,转换后的字体也保持本色,稍加编辑便可完成转换工作。


如图所示,转换后的表格文字识别率不高。

打分:★★★★

 

3.VeryPDF2Word

一款英文软件。为提高测评效率不注册在此只试用。


识别率不高,字体也出现了变形,然而小巧的体积和傻瓜式的操作还是让VeryPDF2Word成为一款实用的软件。

再看看它对扫描图像件的识别率:



第二行中的表格经过转换后不能编辑,而是变为存储在Word文件中的图片。明显可见,VeryPDF并不适用于扫描图像件的识别。

综合打分:★★★

 

4.CAJViewer 7.2

又是一款重量级软件,安装后会生成个人图书馆的图标,只需注册便可以遨游电子图书世界。(我猜的,懒得注册= =#)该款软件只支持将全文或选区内文本存为txt格式,所以实用性相对差了一点。以下是转换前后对比图:


我们发现,识别率不高,错别字很多。而且很关键的是CAJViewer无法识别图像,所以综合考虑,还是电子资料的收集和阅览更适合它。

综合打分:★★★

 

5.Solid Converter PDF v6

使用该软件只能将PDF转换为Word中的图片。


鉴于它还有很多功能(见上图),姑且将其列为实用软件之一。

综合打分:★★★

 

6.福昕阅读器

虽然该软件不擅长格式转换(只能将PDF文件转为乱码横行的txt),依然要在此推荐它。因为福昕阅读器自带的打字机功能使之可以直接编辑PDF文件,是遇到填写PDF表格任务的工作者们的福音。

综合打分:★★★★

 

以上便是本猫对PDF-Word转换的一些经验,性能重复的软件在此没有列出,希望能对有需求的普罗大众有所帮助,减少软件筛选的时间~由于电脑莫名的设置问题,汉王OCR在此无法展示,想要探索的同学试试XP下的汉王文豪7600吧!也许会给你惊喜: )

--------------------以下内容为更新1.0-------------------------

7.汉王OCR

安装快捷,傻瓜操作,无奈只擅长纯文字的图像(PDF)转换。以下为效果:

 可见汉王OCR对文字识别除了偶尔的错字外,转换效果还是比较好的。


转换表格时发生的问题:图文重叠,表格框线无法识别:


综合打分:★★★


0 0
原创粉丝点击