程序博客网 > 嵌入式单片机

python爬虫——获取新闻标题

来源：互联网发布：嵌入式单片机编辑：程序博客网时间：2024/06/05 07:40

打开要提取的新闻页面
右键-》审查元素（N）进入开发者界面
进入Network，选中recording network log（红色圆点），筛选
（蓝色漏斗），然后重新加载页面。选择doc，左下第一列即为所选目标。通过headers 和 Responses可以确认是不是我们所要选择的内容。
headers中 Request URL:https://news.sina.cn/2017-08-21/detail-ifykcqaw0391535.d.html?from=wap 就是我们所要爬取的网页的网址，将其复制到requests.get（）中

这里写图片描述

标题的选取。
点击“选择元素”图标，将光标放在标题上，即可看到标题所在代码行。

这里写图片描述

这里可以看到标题的calss 为

<h1 class="art_tit_h1">....</h1>

双击复制art_tit_h1，放入我们的soup.select()中。

这里写图片描述

获取时间

timesource = soup.select('.weibo_time')[0].contents[1].text.strip()type(timesource)timesource

这里写图片描述

注意：

soup.select（）调用的时候
class 用 ‘.*’
id 用 ‘#*’

阅读全文

0 0

嵌入式单片机

嵌入式单片机

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子如果icould满了怎么办 qq直播脸是反的怎么办电脑系统未激活怎么办电脑没有d盘怎么办海尔阿里电视内存不足怎么办电视内存太小怎么办电脑分区删除了怎么办干不了汽车销售怎么办护肤品过敏长痘怎么办护肤品过敏起痘怎么办对洗头膏过敏怎么办胳膊过敏出疹子怎么办被香港海关扣留怎么办香港代购被扣怎么办买到new bairin怎么办消费者买到次品怎么办日本包裹被扣怎么办网购货丢了怎么办被老板亲戚打压怎么办? 老婆出国不肯回来怎么办 htc u ultra卡怎么办用粉底液闷痘了怎么办叶酸基因检测tt怎么办想去外国找工作怎么办网购代理点怎么办国际快递送交海关怎么办美团骑手不接单怎么办被海关扣了怎么办美团退款钱没到怎么办收不到邮局信件怎么办冲话费订单失效怎么办转账显示处理中怎么办发了货卖家退款怎么办茶楼没有生意了怎么办企业不愿意升规怎么办 steam自跨区了怎么办电脑硬盘读取错误怎么办地平线3轮胎打滑怎么办 ps3硬破被升级了怎么办电水壶底盘坏了怎么办 steam买游戏还差几元怎么办