Python抓网页生成Excel文件

来源:互联网 发布:女生下体有味道 知乎 编辑:程序博客网 时间:2024/06/06 04:27

python抓网页,主要用到了PyQuery,这个跟jQuery用法一样,超级给力

贴代码

#-*- encoding:utf-8 -*-import sysimport localeimport stringimport tracebackimport datetimeimport urllib2from pyquery import PyQuery as pq# 确定运行环境的encodingreload(sys);sys.setdefaultencoding('utf8');f = open('gongsi.csv', 'w');for i in range(1,24):    d = pq(url="http://www.weain.mil.cn/cgcms/Enterprise/lingYu?Code=HANGYELINGYU&myFlag=allShow&SiteID=122&PageIndex=%d"%(i));    itemsa=d('dl dt a') #取title元素    itemsb=d('dl dd') #取title元素    for j in range(0,len(itemsa)):        f.write("%s,\"%s\"\n"%(itemsa[j].get('title'),itemsb[j*2].text));    #end for#end for    f.close();


接下来就是用Notepad++打开gongsi.csv,然后转成ANSI编码格式,保存。再用Excel软件打开这个csv文件,另存为Excel文件

0 0