抓取的图片的URL中有中文字的问题
来源:互联网 发布:播放视频文件修复软件 编辑:程序博客网 时间:2024/05/29 13:39
在reader365网站抓取电子书,编写了一个recipe,运行calibre后,抓下的书中只有文字,而没有图片,而对文物而言,图片也是重要的内容,于是花了很大的力气去查找recipe编写的问题,经过跟踪程序的执行,终于发现,网页中的图片,都使用了中文名,如:http://www.readers365.com/wenhua/wh095/图1 仰韶文化蚌壳摆塑龙虎与人骨平面图.jpg,而calibre中内嵌的python下载时不能处理url中的中文,所以下载不了这个网站中的图片。运行中所有图片都会报下载失败。
因为calibre下载并没有相应的程序代码可供修改,本人也没有找到到下载这个网站书籍的办法,在此通报碰到类似问题的人,不要再花力气去找原因了。另外如果 有人有方法解决这个问题,请留言。
0 0
- 抓取的图片的URL中有中文字的问题
- 图片文字识别的问题
- Python抓取给定URL网页里的图片
- 关于WebView中抓取图片的问题
- 抓取一些乱的URL
- DirectShow:图片的抓取
- DirectShow图片的抓取
- httpclient抓取含有汉字的url时转码问题
- 标签TabHost图片文字覆盖的问题
- 关于文字环绕图片的问题
- 网页内容抓取 图片的抓取方法
- C# 通过URL得到图片的问题
- Android 使用url获取数据时的文字编码问题
- 抓取JPG和PDF上的文字
- 抓取网页标签之间的中文字
- java抓取文字的最大相似度
- 图片+文字的JList
- 图片+文字的JList
- 互联网思维到底是什么?
- 正则表达式
- html笔记
- php yii框架 post csrf
- 根据【开始】【结束日期】查询数据库数据
- 抓取的图片的URL中有中文字的问题
- Android:onNewIntent()触发机制及注意事项
- unsigned char拼接
- 【已解决】Navicat 远程连接 Linux服务器上的MySQL数据库
- CodeForces 604B More Cowbell
- [转]matlab的Virtual Reality(虚拟现实)工具箱的应用简介
- 王学岗音乐播放器(待续)
- 上线流程
- Material Design之SwipeRefreshLayout