python 将百度搜索风云榜的关键内容提取并写入txt文件和读取验证

来源:互联网 发布:网络知识视频教程 编辑:程序博客网 时间:2024/05/15 20:36

# -*- coding:UTF-8 -*-from bs4 import BeautifulSoupimport requests,sysimport codecs##今日娱乐名人排行榜--百度搜索风云榜  http://top.baidu.com/buzz?b=618&fr=topindextarget='http://top.baidu.com/buzz?b=618&fr=topindex'req=requests.get(url=target)##很重要,视你得到的网页编码req.encoding='gb2312'##审查元素后找到人名所在的divhtml=req.textbf=BeautifulSoup(html)texts=bf.find_all('a',class_='list-title')##创建或打开要写入的文件f = codecs.open("name.txt",'w','utf-8') ##将娱乐名人排行榜的内容存入文件for text in texts:##    print(text.string)    f.write(str(text.string+'\r\n')) f.close()##读取文件验证写入的内容file =  codecs.open('name.txt','r','utf-8')lines = file.readlines()names=[]for line in lines:    names.append(line.strip('\r\n'))print(names) #2.x请将此行改为 print names

结果