网页保存为PDF或图片的方法

来源:互联网 发布:淘宝 协同过滤 编辑:程序博客网 时间:2024/04/29 07:11

     对于一些网页,我想把它们完整的保存下来,但是保存为html,会随之下载下来css、js和图片文件,如果保存成mht,不保证在任何电脑都能打开,涉及到编码的问题等等。

     于是想能否保存为一幅图片或是pdf文档,这两种办法都是针对设计比较有特色的网页而言。目前尝试了两种办法:

办法一:使用插件程序——pdf download

       对于一般的网页都能胜任,针对firefox和Internet Explorer 7以上的程序分别可以在网站:http://www.pdfdownload.org上下载。

     但是容易出现的问题有两个:

     (1)如果网页内容很多或者网速不快,那么就要等待一段时间

     (2)很容易出现的问题是网页保存出现不太正常,比如字体显示问题等

     (3)如果网页上有视频或音频内容,就更容易出问题了

     当然,也可能是我的使用的问题,其实没有谁能说自己完全精通浏览器的使用了?


办法二:使用虚拟打印程序——doPDF或Fineprint等


     在这种方法里,其中的一步可以把网页直接保存为图片,但是有一个问题要注意:

     由于现在网页设计技术多种多样,如果网页上元素很多,在使用这些程序保存时很容易会出现一个问题,就是网页结构容易变形。

     另外有个问题也是我经常遇到的,就是保存出来的文章上下分别会有两行字,在文档顶部显示的是标题和网站地址,在文档底部显示的是该网页原来的网址。

     当然我们使用其他的可以在PDF文档或图片中去掉这些,不过这无疑又增加了一道工序。这里只是在保存的时候多走一步,就可以去掉这些东西了。

     首先这个办法针对Firefox有效,对于IE未作测试。

     选择“print preview打印预览”,在其中的“Page Setup”中全部选择--blank--,同时在这里还可以设置当前页的各个边距,比如top、bottom、left、right等。

    设置完之后就可以去掉网页上下的这两行文字了。

    接下来就要针对网页变形和文件丢失做设置了。

    网页变形和文件丢失的问题,我只找到了一种办法,那就是调节虚拟打印的文档的尺寸,在虚拟打印机中将预置的A4增大至A3、A2,或者说自定义,都可以。总的原则就是把“Paper Size纸张尺寸”往大的方向调,只要能完全放下网页或更大,那么网页元素变形或丢失的问题就解决了。

     随之而来的问题是,这样保存出来的文档尺寸会比平常所见的A4大一些。

注意:纸张尺寸要在doPDF或Fineprint中调节。



 

     经过使用,这两种办法各有其擅长的地方,因此根据实际情况使用,同时还有一些地方可以自行设置,比如保存图片的质量、缩放比例等,都可以继续设置来满足需要。