程序博客网 > 自己动手装修房子软件

python获取网页上所有链接

来源：互联网发布：自己动手装修房子软件编辑：程序博客网时间：2024/06/05 20:39

import urllib2   #获取源码的函数，urllib3更换 urllib.request.urlopen(url).read()      return urllib2.urlopen(url).read()    def get_next_target(page): #每次处理page中寻找链接的函数      start_link = page.find('<a href=')      if start_link == -1:          return None, 0      start_quote = page.find('"', start_link)      end_quote = page.find('"', start_quote + 1)      url = page[start_quote + 1:end_quote]      return url, end_quote    def print_all_links(page): #循环寻找      while True:          url, endpos = get_next_target(page)          if url:              print (url)              page = page[endpos:]          else:              break    #print_all_links(get_page('http://xkcd.com/353'))  print_all_links(get_page('http://www.baidu.com')) #用百度做一下实验

还没有完善，a标签触发的javascript事件还未处理。一些函数在python3中不能用，最近学的是python2的课程。

0 0

自己动手装修房子软件

自己动手装修房子软件

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子红米手机小米账号密码忘了怎么办小米5splus没系统卡米怎么办注册谷歌账号输入手机好怎么办谷歌注册电话号码用了太多次怎么办内存卡用了深度清理的软件怎么办华为畅享5s密码忘了怎么办小米5s进水了一直开机关机怎么办手机菜单键功能键返回键失灵怎么办小米5s更新系统发热严重怎么办小米手机4G网速不好怎么办力红米5 plus开不开机怎么办小米3s手机触屏部分失灵怎么办魅族手机屏幕锁密码忘了怎么办手机没设置魅族账号密码忘了怎么办魅族手机格式化密码忘了怎么办魅族手机忘记密码了怎么解锁怎么办手机设置的应用加密忘记密码怎么办手机上设置应用加密忘记密码怎么办魅蓝flyme密码忘了怎么办图片魅族手机经常自动账号锁屏怎么办魅族锁定后又不知道密码怎么办魅族手机锁屏锁定了怎么办魅族手机已锁定怎么办密码忘了京东抢到了小米8不发货怎么办第一次网上预约没有就诊卡号怎么办京东定金交了未发货怎么办买了没有预售许可证的房子怎么办买了没有预售证的房子怎么办苹果手机发烫容易变3g网怎么办魅族手机有指纹和密码怎么办刷机魅族手机指纹解锁密码忘了怎么办魅蓝5s运存占用太多怎么办魅蓝e2手机照片被删了怎么办魅蓝e2不小心删除了照片怎么办魅蓝3s返回键失灵怎么办糖猫电话手表屏碎了怎么办魅蓝手机没下安装包强制更新怎么办老婆赌博输了30多万现在怎么办啊红米nt2手机通话声音小怎么办? 微信退出后重新登录忘记密码怎么办微退出后再登录忘记密码了怎么办