利用python 实现简单 爬虫

来源:互联网 发布:java发送图片 编辑:程序博客网 时间:2024/06/04 18:29
# coding:utf-8import reimport requests# 获取网页内容import pickler = requests.get('http://www.163.com')data = r.textserialInfo = '';# 利用正则查找所有连接link_list =re.findall(r"(?<=content=\").+?(?=\")|(?<=content=\').+?(?=\')" ,data)for url in link_list:    serialInfo += url+'----';    print urlf=open('demo.txt','wb',0)pickle.dump(serialInfo,f)obj2 = pickle.load(open("demo.txt", "r"))print '-------->'print obj2f.close()
0 0
原创粉丝点击