用python爬取我的百度经验目录
来源:互联网 发布:淘宝网图书松下幸之助 编辑:程序博客网 时间:2024/05/18 02:48
获得每一篇文章的链接:
import reimport urllib.requestdef getHtml(url): page = urllib.request.urlopen(url) html = page.read() return htmldef getImg(html): reg = r'<a href="([.*\S]*\.html)" title=' imgre = re.compile(reg); imglist = re.findall(imgre, html) return imglisturl = "https://jingyan.baidu.com/user/npublic/?uid=d1b612bceb0dc22ba8ffe137&pn="for i in range(0,89*7,7): i = str(i) a = url+i html = getHtml(a) html = html.decode('UTF-8') for i in getImg(html): print("https://jingyan.baidu.com"+i)
爬取标题:
import reimport urllib.requestdef getHtml(url): page = urllib.request.urlopen(url) html = page.read() return htmldef getImg(html): reg = r'<a href="([.*\S]*\.html)" title=' reg = r'title="([.*\S]*\?)" target=' imgre = re.compile(reg); imglist = re.findall(imgre, html) return imglisturl = "https://jingyan.baidu.com/user/npublic/?uid=d1b612bceb0dc22ba8ffe137&pn="for i in range(0,89*7,7): i = str(i) a = url+i html = getHtml(a) html = html.decode('UTF-8') for i in getImg(html): print(i)
阅读全文
0 0
- 用python爬取我的百度经验目录
- 用Mathematica爬取我的百度经验目录
- 我的百度经验列表
- python用urllib爬取百度
- Python 爬取百度图片
- python爬取百度图片
- Python爬取百度图片
- python爬取百度百科
- python爬取百度图片
- Python-爬取百度音乐
- Python 爬取百度音乐
- Python 爬取百度图片
- Python爬取百度图片
- Python 爬取百度词条Python Demo
- Python爬取百度贴吧的图片
- 使用Python爬取百度贴吧的图片
- 简单的python爬虫(爬取百度百科词条)
- python爬虫爬取百度贴吧的信息
- 关于播放器锁屏图片不显示问题
- 计算1/1-1/2+1/3-1/4+1/5 …… + 1/99
- window环境下安装及使用composer[初体验篇]
- 001-spring boot 之helloworld
- 微信小程序ajax请求绑定数据简单实例
- 用python爬取我的百度经验目录
- Session和cookie
- 带附加头节点的广义表链表表示及相关运算c++源码分享
- 每日一练26
- React-Native 运行demo遇到的相关问题(持续更新)
- TreeMap 根据key 倒序排序
- 赵薇丈夫黄有龙不服处罚,要求证监会举行听证会,这比贾跃亭的吃相更难看
- Python抓取淘宝美人库
- 欢迎使用CSDN-markdown编辑器