python 获取页面表格数据存放到csv中
来源:互联网 发布:软件项目沟通计划 编辑:程序博客网 时间:2024/06/07 18:56
获取单独一个table,代码如下:
#!/usr/bin/env python3# _*_ coding=utf-8 _*_import csvfrom urllib.request import urlopenfrom bs4 import BeautifulSoupfrom urllib.request import HTTPErrortry: html = urlopen("http://en.wikipedia.org/wiki/Comparison_of_text_editors")except HTTPError as e: print("not found")bsObj = BeautifulSoup(html,"html.parser")table = bsObj.findAll("table",{"class":"wikitable"})[0]if table is None: print("no table"); exit(1)rows = table.findAll("tr")csvFile = open("editors.csv",'wt',newline='',encoding='utf-8')writer = csv.writer(csvFile)try: for row in rows: csvRow = [] for cell in row.findAll(['td','th']): csvRow.append(cell.get_text()) writer.writerow(csvRow)finally: csvFile.close()
获取所有table,代码如下:
#!/usr/bin/env python3# _*_ coding=utf-8 _*_import csvfrom urllib.request import urlopenfrom bs4 import BeautifulSoupfrom urllib.request import HTTPErrortry: html = urlopen("http://en.wikipedia.org/wiki/Comparison_of_text_editors")except HTTPError as e: print("not found")bsObj = BeautifulSoup(html,"html.parser")tables = bsObj.findAll("table",{"class":"wikitable"})if tables is None: print("no table"); exit(1)i = 1for table in tables: fileName = "table%s.csv" % i rows = table.findAll("tr") csvFile = open(fileName,'wt',newline='',encoding='utf-8') writer = csv.writer(csvFile) try: for row in rows: csvRow = [] for cell in row.findAll(['td','th']): csvRow.append(cell.get_text()) writer.writerow(csvRow) finally: csvFile.close() i += 1
阅读全文
1 0
- python 获取页面表格数据存放到csv中
- 使用python将csv数据导入到sqlite中
- python读出mysql数据写出到csv文件中[整理]
- 用Visual C#如何调用Excel,如何又把数据存放到Excel表格中
- Python批量下载网页中的表格存储到CSV文件中
- jquery 使用ajax请求数据显示到页面表格中
- 从Jsp页面导出数据到Excel表格中
- c++中将数据存储到.csv文件中(类似于xsl表格)
- Python获取数据库数据并保存在excel表格中
- python从excel表格中获取时间格式的数据
- python创建csv表格
- python提取百万数据到csv文件
- python实战三:通过任务计划定期获取jira数据并保存到csv
- cocos2dx Excel表格数据通过csv保存到数据库sqlite
- 利用vc实现数据表格导出到CSV文件
- 网页端中将表格数据和JSON数据读取(导出)到本地的excel和csv文件中
- 动态数据存放到文本文件中
- 数据分区存放到文件中
- Android 6.0权限申请明细
- CHAR 与 VARCHAR的区别
- UDP简介
- 多级导航,转自http://blog.csdn.net/rabbitter/article/details/51125337
- Spring初始化
- python 获取页面表格数据存放到csv中
- centos系统服务配置初始化
- windows下配置mingw的方法:theano+keras+mingw
- Android常用开源项目(三十二)
- dpdk之多进程client_server_mp源代码分析
- js 数组去重5个常用算法
- python 调用Google Translate API 翻译
- ios开发—变量属性
- 1002. 等价二叉树