利用Python实现网络爬取图片

来源:互联网 发布:vb控件工具箱 编辑:程序博客网 时间:2024/06/14 06:07
#如果没有安装requests的在cmd模式下输入 pip install requests即可安装,然后在pycharm下写入下面的代码,即可实现爬取指定网页上的图片了。
import requestsimport re
img_url='https://www.sxtp.net/meinv/hanguo/'     //这里的地址就是你想爬取图片的网址reponse=requests.get(img_url)reponse.encoding="utf-8"html=reponse.textprint(html)img_urls=re.findall(r'src="(https://tupian.sxtp.net/d/file/\w+/\w+\.jpg\!xiaotu)"',html)   //此处的写法对应于特定网页中图片的表达,所以要根据实际情况来写
print(img_urls)print(len(img_urls))for img_url in img_urls:    img_file_name=img_url.split('/')[-1]    img_file_name=str(img_file_name)    img_file_name=img_file_name[:-1]                //刚接触Python不知道如何删除字符串中后面的!xiaotu,所以就一个一个删了啊!尴尬    img_file_name=img_file_name[:-1]    img_file_name=img_file_name[:-1]    img_file_name=img_file_name[:-1]    img_file_name=img_file_name[:-1]    img_file_name=img_file_name[:-1]    img_file_name=img_file_name[:-1]    print(img_file_name)    img_data=requests.get(img_url).content    with open(img_file_name,'wb')as f:        f.write(img_data)