利用BS实现安居客房地产中介信息的爬取
来源:互联网 发布:大学数据库课程设计 编辑:程序博客网 时间:2024/04/26 23:32
http://beautifulsoup.readthedocs.io/zh_CN/latest/ 这是官方文档
利用BS对安居客上主要信息的爬取。
红框框内的就是这次爬取的主要信息,bs对于正则表达式来说,简单了许多,比如说:
利用F12加F5,进行查询,当我们查看,我们需要的信息在哪一个类的下面,它的标签是什么。当我们需要的时候用什么标签进行提取,还有具体不懂的地方可以进行观看官方文档。
这是全部的代码:
#!/usr/bin/python# -*- coding: utf-8 -*from bs4 import BeautifulSoupimport urllibimport urllib2import reimport osi=1for i in range(1,7): url=' https://beijing.anjuke.com/tycoon/pi' user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)' headers = { 'User-Agent' : user_agent } request = urllib2.Request(url,headers = headers) response = urllib2.urlopen(request) content = response.read() soup=BeautifulSoup(content) text=soup.find_all('div',class_='jjr-itemmod') for k in text: s=(k.get_text(strip=True))+'\n' print s f1 = open('58.txt','a') f1.write(s.encode('UTF-8')) f1.close()
阅读全文
0 0
- 利用BS实现安居客房地产中介信息的爬取
- 用bs爬取安居客优秀经理人信息
- 安居客信息爬取
- Python爬取安居客新房信息
- Java爬虫-利用jsoup(抓安居客房源)
- bs4+phantomjs爬取安居客二手房信息
- 仿安居客房贷计算器
- Python爬虫实战(3):安居客房产经纪人信息采集
- 【R语言 爬虫】用R爬虫,爬取杭州安居客九堡租房信息
- python的bs的简单实例爬取58同城手机信息
- php爬取安居客小区数据
- scrapy安居客二手房爬取
- 金钥匙地产中介 是什么
- Android仿安居客房源详情页图片显示
- python3 [爬虫实战] selenium + requests 爬取安居客
- python3 [爬虫实战] selenium + requests 爬取安居客
- 利用jsoup爬取网页信息
- 使用Jsoup实现简单的页面信息爬取
- web安全学习规划
- 任务管理器上的菜单栏没有了怎么恢复?
- linux快捷键
- 响应式布局设置--@media only screen and
- java高级特性:File I/O
- 利用BS实现安居客房地产中介信息的爬取
- oracle数据迁移常用脚本
- uva 1586
- 挖掘频繁模式、关联和相关性:基本概念和方法
- Linux内核源码分析(一)--序言
- PlantUML: 使用简单的文字描述画UML图,入门
- babyos2(14)—— 用户态栈的扩展,加载elf
- java并发多线程
- 曲率