程序博客网 > c语言随机数

自学爬虫程序-1、最简单爬虫代码

来源：互联网发布：c语言随机数编辑：程序博客网时间：2024/06/14 22:23

爬取一个网页内的信息
1、通过F12开发员工具分析网页内的内容，找到需要爬取内容的位置
可以拓展：

1.1 用什么浏览器的开发人员工具最好，现在用的是360浏览器，基本能满足功能

1.2 怎么找到你要爬取信息的位置，现在要爬取的是新闻内容，基本在doc里面的第一个网页

后续可能会有js、css、ajax等，这些信息要学习

2、正式写程序

2.1、定义要用到的控件

from bs4 import BeautifulSoup
import requests

2.2 通过requests将内容下载下来

res=requests.get('http://news.china.com/international/1000/20170915/31421852.html')

2.3 定义编码

res.encoding='utf-8'

2.4 将内容放入soup内
soup=BeautifulSoup(res.text,'html.parser')

2.5 提取所需的网页内信息，假设为新闻标题
titleNews=soup.select('h1')[0].text

是看结果
print (titleNews)

阅读全文

0 0

c语言随机数

c语言随机数

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子后背脊椎中间疼怎么办后背脊柱中间疼怎么办后背中间脊椎疼怎么办背部脊椎中间疼怎么办木地板颜色深了怎么办脚趾甲变厚变空怎么办指甲变厚变黄怎么办指甲长进肉里怎么办手指甲长进肉里怎么办脚指甲变黄变厚怎么办指甲变黄变厚怎么办嵌甲化脓了怎么办指甲刺肉里面怎么办脚上甲沟炎该怎么办手指甲嵌进肉里怎么办指甲长进肉里面怎么办指甲长肉里面怎么办指甲无半月痕怎么办没有半月痕少怎么办指甲没有月牙是怎么办手指上没有月牙怎么办女性肝郁气滞怎么办心脏血管硬化该怎么办三尖瓣少量返流怎么办二尖瓣少量返流怎么办二尖瓣大量反流怎么办半月板后角变性怎么办初生儿睡觉不好怎么办子宫动脉切迹怎么办输软管有积水怎么办胎儿三尖瓣返流怎么办做四维宝宝趴着怎么办产后妊娠纹发痒怎么办羊水穿刺有问题怎么办三尖瓣轻度返流怎么办三尖瓣中度返流怎么办四维心脏畸形怎么办羊水穿刺高风险怎么办精子畸形率高怎么办因胎儿发育不好怎么办胎儿停止发育了怎么办