关于Matlab下爬取网络图片问题
来源:互联网 发布:星星知我心演员胡家玮 编辑:程序博客网 时间:2024/05/24 02:25
因项目需要,需要爬取一些网上的图片,于是在Matlab下试了一下urlread、urlwrite和websave等,均没能成功爬取一张图片。当然,有些错误为一些网站拒绝被爬取,但是用Python轻松爬取,不知是否因为Matlab在这方面还不太成熟还是为何。后来,仔细查看urlwrite相关说明,设置了一些相关参数,爬取成功。其中按照注释的urlwrite则无法爬取成功。代码如下:
clcclears=urlread('http://blog.csdn.net/u011501388/article/details/78351305');pat='http://[^" \n=]*.jpg';expr= regexp(s, pat, 'match');fid=fopen('E:\images.txt','a');fprintf(fid,'\n%s\r\n',expr{:});fclose(fid);data=importdata('E:\images.txt');for i=1:length(data)a=data{i};% s=urlwrite(a,sprintf('%d.jpg',i));% s=urlwrite(a,a);try% options = weboptions('Timeout',Inf,'RequestMethod','post');% s=websave(a,a,'term','simulink','duration',7,options);s=urlwrite(a,sprintf('%d.jpg',i), 'UserAgent','MATLAB R2015b','Timeout',100,'Get',{'term','urlread'});catch ME continueendI=imread(s);imwrite(I,strcat('E:\images\',int2str(i),'.jpg'));end
其中网址为本人的blog网址,images.txt结果如下:爬取的结果图片在images文件夹下,如图所示:
从结果可以看到,有些图片没能成功抓取。
现在把网址换成如下,可以爬取二次元图片:
https://image.baidu.com/search/index?tn=baiduimage&ct=201326592&lm=-1&cl=2&ie=gbk&word=%B6%FE%B4%CE%D4%AA&fr=ala&ala=1&alatpl=adress&pos=0&hs=2&xthttps=111111
爬取结果如下:
参考:
1. websave
2. urlwrite with http authentication
3.urlwrite
4. urlread
阅读全文
0 0
- 关于Matlab下爬取网络图片问题
- 关于获取网络图片问题
- 关于matlab连续读入图片的问题
- 关于matlab 线性规划问题
- 关于安卓查看网络图片的一些问题
- Xcode7中关于下载网络图片报错的问题
- 关于iOS网络请求tabbart图片显示不正常的问题
- 网络加载图片问题
- 关于matlab中pcolor显示图片时的shading设置问题
- 关于matlab中的colormap问题
- 关于fedora24安装matlab问题
- 关于图片的问题
- 关于图片问题
- 关于图片加载问题
- 关于网络问题
- 关于诊断网络问题
- matlab图片偶尔不能显示问题
- 网络图片浏览器异常问题
- HBase建表时报错问题之:ERROR: org.apache.hadoop.hbase.PleaseHoldException: Master is initializing
- myBatis-list数据插入Oracle
- C++中istringstream的用法
- soap相关元素的介绍
- 自己动手搭梯子——从vps到SSR菜鸟教程
- 关于Matlab下爬取网络图片问题
- Spring知识笔记(2):AOP和IOC
- 解决Android Studio报错 Cause: error in opening zip file
- 【AGC005F】Many Easy Problems FFT 容斥原理
- Go 语言 select 语句
- json dict python base64
- Linux jdk安装与环境配置
- Codeforces Round #442 (Div. 2) B. Nikita and string
- 【Sqlite】使用教程(2)