Ptyhon爬虫实战(七):爬取汽车公告网上的批次排量等信息

来源:互联网 发布:linux 返回值 编辑:程序博客网 时间:2024/04/28 05:59

网址:http://www.cn357.com/notice/


直接上代码。


#coding=utf-8import reimport requestsdef getHtml(url):    try:        page = requests.get(url)        html = page.text        return html    except:        print ("网页访问异常")        return ""def getInfo(html):    reg = re.compile(r".*?公告批次:(.*?),生产企业:.*?识别代号:(.*?),轴数:.*?发动机排量:(.*?),发动机功率:",re.S)    items = re.findall(reg,html)    for item in items:        print("\t".join(list(map(str.strip,item))))if __name__=='__main__':    for i in range(1,61):        url = "http://www.cn357.com/cvi.php?m=cvinotice&search=n&brand=%B1%F0%BF%CB&page=" + str(i)        html = getHtml(url)        getInfo(html)


阅读全文
0 0
原创粉丝点击