微博爬虫——爬取指定范围内所有帖子包含的定位信息的方法

来源:互联网 发布:手机注册淘宝小号 编辑:程序博客网 时间:2024/05/01 08:05

1.登录(python selenium.webdriver实现)

 


 

 

 

 

 

2.用微博高级搜索找到数据来源(url),图3为数据源url截图

 

1

 

2

 

3

 

 

 

3.循环获取带定位信息的url,并存入数据库,如图4所示。(python实现)

 

 

 

 



 

4

 

 

4.读数据库url数据并依次访问

 

 

 

5.获取该url下对应的地点名以及地点描述(或者地点类型和地址),并存入数据库,如图5所示

 


 

5

 

0 1
原创粉丝点击