某徒步旅游网站python爬虫小练习
来源:互联网 发布:java集合框架中抽象类 编辑:程序博客网 时间:2024/05/17 09:04
yxk周边游网站python爬虫小练习(跨页面)
代码很简单,关键一个是 encoding="utf_8_sig"
, 否则乱码,注意writerow()
处理list
import warningswarnings.filterwarnings("ignore")
import csv from urllib.request import urlopenfrom bs4 import BeautifulSoupcsvFile=open("C:\\Users\\dell-pc\\Documents\\Python Scripts\\Untitled Folder\\uxiake.csv","wt",newline="",encoding="utf_8_sig")writer=csv.writer(csvFile)try: for i in range(9): num=str(i+1) html=urlopen("http://www.youxiake.com/around?place_id=2&days=0&month=0&holiday=0&price=0&tag=0&class_id=0>s=>e=&p="+num) bs0bj=BeautifulSoup(html) total=bs0bj.find("div",{"class":"m-bd-con current"}).findAll("div",{"class":"act-item clearfix"}) for i in total: putin=[] head=i.find("h3").find("a").get_text() style=i.find("h3").find("span").get_text() place=i.find("div",{"class":"z-subMsg"}).findAll("p")[0].get_text() days=i.find("span",{"class":"days"}).get_text() venue=i.find("span",{"class":"venue"}).get_text() putin.append([head,style,place,days,venue]) for i in putin: writer.writerow(i)finally: csvFile.close()
阅读全文
0 0
- 某徒步旅游网站python爬虫小练习
- Python 旅游博客爬虫
- 【python小练习】百度图片小爬虫
- 【旅游】【转载】如何徒步虎跳峡
- python 实现网站图片抓取小爬虫
- python 爬虫某网站图片
- python爬取携程和蚂蜂窝的景点评论数据\python爬取携程评论数据\python旅游网站评论数据爬虫
- python网页爬虫练习
- python爬虫第一次练习
- Python爬虫练习
- python爬虫练习1
- python爬虫练习1
- python爬虫练习2
- python爬虫练习3
- python简单爬虫练习
- python小爬虫—抓取pixabay网站的图片资源
- python爬虫(上)--请求——关于旅游网站的酒店评论爬取(传参方法)
- nodeJs爬虫小程序练习
- python 案例006 (斐波那契数列)
- ES6之字符串的拓展(部分)
- 一个简单的例子模拟JDK动态代理
- 浅谈java内部类及其作用
- 08、MySQL代码执行结构
- 某徒步旅游网站python爬虫小练习
- 二叉树
- linux的jdk安装
- eclipse中启动tomcat而浏览器无法访问http://localhost:8080
- sturts2: jsp 与action之间的list传送
- iOS AFN 3.0版本前后区别 01
- mysleep的实现
- C++专项训练-1
- tensorFlow测试及屏蔽warning信息