获取最新中国行政区划
来源:互联网 发布:程序员一年经验工资 编辑:程序博客网 时间:2024/04/29 06:48
废话少说,上代码:
import urlparsefrom StringIO import StringIOimport datetimeimport requestsimport lxmlfrom lxml import etreedef get_latest_url(index_url): response=requests.get(index_url) parser=etree.HTMLParser() tree = etree.parse(StringIO(response.content ), parser) r = tree.xpath('//ul[@class="center_list_contlist"]') if len(r)==1: div=r[0] href = div.xpath('li/a/@href')[0] return urlparse.urljoin(index_url,href) else: return Nonedef get_xingzhengquhua_text(latest_url, referer=None): response=requests.get(latest_url) parser= etree.HTMLParser() tree = etree.parse(StringIO(response.content ), parser) r = tree.xpath('//div[@class="xilan_con"]') print r if len(r)==1: div=r[0] div2 = div.xpath('div/div')[0] div3 = div2.xpath('.//p') p=[] for line in div3: #line = line.replace(u'\xa0', u' ').strip() #if not line: # continue try: code=line.xpath('span[1]/text()')[0] name=line.xpath('span[2]/text()')[0].strip(u'\u3000') except: continue if code.endswith('0000'): parent='' elif code.endswith('00'): parent=code[:2]+'0000' else: parent=code[:4]+'00' p.append((parent,code,name)) text='\n'.join(map(lambda x:','.join(x),p)) text=text.encode('utf-8') print text return text else: text=Noneif __name__ == '__main__': index_url='http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/' #latest_url='http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/201401/t20140116_501070.html' latest_url=get_latest_url(index_url) print latest_url if latest_url: text=get_xingzhengquhua_text(latest_url) filename=latest_url.strip().split('/')[-1] print filename try: filename=filename.split('_')[0][1:] except: now=datetime.datetime.now() filename=now.strftime('%Y-%m-%d') if text: ff=open('latest-xingzhengquhua-%s.txt' % filename,'w') ff.write(text) ff.close() else: print 'Failed get xingzhengquehua data!' else: print 'Failed get latest data url'
0 0
- 获取最新中国行政区划
- php获取全国最新省市区行政区划数据
- 最新行政区划编码数据
- 中国行政区划分类之行政区划名
- 获取国家统计局行政区划表
- 中国行政区划的英文介绍
- 从百度地图批量获取中国县级以上行政区划边界坐标
- 教学课件 —— 中国行政区划
- JadePool应用范例:实现中国行政区划管理
- 中国各级行政区划的英文表达
- 行政区划
- 中国最新行政区划51个城市哈密顿回路19348千米:2个行政院、8个直辖市、3个特别行政区、7个自治区、31个省。
- 开源项目 —— 中国行政区划数据
- 中国行政区划代码数据库文件 - 最新县及县以上行政区划代码(截止2012年10月31日)
- 中国各行业龙头股-最新
- android开发之定位,获取行政区划的实现
- 从第三方api获取行政区划市级以上数据
- 行政区划官方数据--java对象或json-java爬虫获取
- 我已经开始使用Jekyll做博客了(http://truckli.gitcafe.io)
- 小糖出品:oc中#import和#include之间的区别
- 中兴通讯笔试题
- 提高第18课时,实践3,当年第几天(数组方案)
- python模块的常用安装方式
- 获取最新中国行政区划
- eCos入门开发环境eCosBox简介
- IOS开发人员不得不知道的一些事情
- 03.(最新版)百度地图§覆盖物OverlayOptions
- Introduction
- quartz 2D 总结
- 基于VS2010平台的MFC入门编程——简易加法计算器
- 死锁与优先级翻转
- POJ 3190 Stall Reservations(贪心)