程序博客网 > 北京java培训中心

定向网页爬取

来源：互联网发布：北京java培训中心编辑：程序博客网时间：2024/05/17 06:28

#coding=utf-8import requestsfrom bs4 import BeautifulSoupimport bs4import sysreload(sys)sys.setdefaultencoding( "utf-8" )def getHTMLText(url):    try:        r = requests.get(url, timeout=30)        r.raise_for_status()        r.encoding = r.apparent_encoding        return r.text    except:        return ""def fillUnivList(ulist, html):    soup = BeautifulSoup(html, "html.parser")    for tr in soup.find('tbody').children:        if isinstance(tr, bs4.element.Tag):            tds = tr('td')            ulist.append([tds[0].string, tds[1].string, tds[3].string])def printUnivList(ulist, num):    tplt = "{0:^10}\t{1:{3}^10}\t{2:^10}"    print(tplt.format("排名", "学校名称", "总分", chr(12288)))    for i in range(num):        u = ulist[i]        print(tplt.format(u[0], u[1], u[2], chr(12288)))def main():    uinfo = []    url = 'http://www.zuihaodaxue.cn/zuihaodaxuepaiming2016.html'    html = getHTMLText(url)    fillUnivList(uinfo, html)    printUnivList(uinfo, 20)  # 20 univsmain()

阅读全文

0 0

北京java培训中心

北京java培训中心

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子人身保险新型产品人身伤残鉴定标准人身保险一年多少钱人身意外险哪种好人身意外伤害赔偿标准人身伤残评定标准人身损害赔偿法条人身意外死亡保险人身商业险多少钱交通事故人身损害赔偿人身损害赔偿鉴定标准人身保险理赔案例人身伤情鉴定标准交通事故人身伤害赔偿人身损害赔偿伤残标准人身轻伤鉴定标准人身意外保险如何赔偿九级人身损害赔偿标准雇工人身损害赔偿标准驾驶员人身意外险人身损害伤残鉴定程序人身意外险赔偿金额人身意外险怎么买人身意外险哪家好人身意外险怎么办理人身保险索赔时效人身意外保险范围人身损害诉讼时效人身侵权损害赔偿标准人身损害赔偿代理词人身伤害伤残鉴定程序人身损害鉴定农村小额人身保险旅游人身意外保险人身损害赔偿计算器人身保险发展历程人身损害死亡赔偿标准怎样买人身意外险人身保险理赔流程人身保险的特殊性小学生人身意外险