程序博客网 > 阿里云直播

用python来为自己办事-抓取网页内容

来源：互联网发布：阿里云直播编辑：程序博客网时间：2024/05/21 06:36

import sys,urllib
url="http://www.putclub.com/html/radio/VOA/presidentspeech/index.html"
wp = urllib.urlopen(url)
print "start download..."
content = wp.read()

print content.count("center_box")
index = content.find("center_box")
content=content[content.find("center_box")+1:]
content=content[content.find("href=")+7:content.find("target")-2]
filename = content
url ="http://www.putclub.com/"+content
print content
print url
wp = urllib.urlopen(url)
print "start download..."
content = wp.read()

#print content
print content.count("<div class=\"content\"")
#content = content[content.find("<div class=\"content\""):]
content = content[content.find(""):]
content = content[:content.find("<div class=\"dede_pages\"")-1]
filename = filename[filename.find("presidentspeech")+len("presidentspeech/"):]

filename = filename.replace('/',"-",filename.count("/"))
fp = open(filename,"w+")
fp.write(content)
fp.close()
print content

0 0

阿里云直播

阿里云直播

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子经期出现大卵泡怎么办哺乳期母猫拉稀怎么办左侧卵巢偏小怎么办右卵巢小囊肿怎么办 30岁切除卵巢怎么办 26岁卵巢功能低怎么办促排卵卵泡太多怎么办排卵期内膜厚度3怎么办卵泡成熟内膜薄怎么办有卵泡不排出怎么办卵泡正常个数多怎么办试管基础卵泡少怎么办卵泡太大不排怎么办卵泡长得太大怎么办卵泡排不出去怎么办小卵泡就排卵怎么办卵泡过大不排怎么办卵泡个数多多囊怎么办卵子长得慢怎么办卵巢一侧不排卵怎么办黄体生成素低怎么办卵泡生成素偏高怎么办元旦结婚冷怎么办呀? vivox21手机起热怎么办手机起热严重怎么办医院办转诊手续怎么办鱼梁洲开发居民怎么办南京游园年卡怎么办别人骂我父母怎么办孩子生气躲起来怎么办饲养鸵鸟威胁人怎么办小猫咪害怕人怎么办小猫刚到家害怕怎么办猫咪太过于胆小怎么办飞机航班查不到怎么办成都地铁掉钥匙怎么办南京地铁丢东西怎么办安检处丢失东西怎么办东西落在地铁上怎么办东西忘地铁上怎么办东西落地铁上怎么办