python爬虫慕课网实例（二）

来源：互联网发布：谷歌人工智能开源编辑：程序博客网时间：2024/06/06 20:24

三网络图片的爬取和存储

还是使用requests库进行爬取，此时的URL变成了图片的网络地址

path为图片爬取下来后存储的地址

r.content返回的是文件的二进制形式

执行完代码之后便能在D盘找到名为123.jpg的文件

四百度关键词提交

百度搜索时关键词格式http://www.baidu.com/s?wd=keyword

爬取是只要把keyword设置成自己想要查找的东西即可

import requests

url='http://www.baidu.com/s?'

kv={'wd':'python'}#搜索词为python

r=requests.get(url,params=kv)#将wd=python插入到URL后面

查看此时的URL

可以访问

这个例子主要是用到params

>>> url_params = {'key':'value'} #字典传递参数，如果值为None的键不会被添加到url中
>>> r = requests.get('your url',params = url_params)
>>> print(r.url)
　　your url?key=value

文中用的params 也可以使用'wd='+'python'来连接字符是URL完整

阅读全文

1 0