python爬虫入门(一)
来源:互联网 发布:新闻文章网站源码 编辑:程序博客网 时间:2024/05/22 17:14
今天有个朋友问我,你能不能帮我写个能下载一个网页上所有图片的脚本呀?我一想,刚好最近在学python,学到了URL这一块,就尝试着写了几个简单的脚本练了练手。其实自己也只是试了试 urllib2 这个模块确实是很强大的功能,简单的贴几行今天写的小代码(认真脸# 。#)
import urllib2,sysresponse = urllib2.urlopen('http://www.baidu.com/')html = response.read()fp = open("/home/ubuntu/python/file/baidu.txt","w")fp.write(html)fp.close()print html
这里直接将百度首页的所有代码保存下来,存到 *baidu.txt,同时打印www.baidu.com HTML 内容。
0 0
- python爬虫入门(一)
- python 入门爬虫(一)
- Python 爬虫入门(一)
- Python爬虫入门一
- Python爬虫入门一
- Python爬虫入门 (一)
- Python爬虫总结(一)入门
- Python爬虫入门(一)写在前面
- Python爬虫一(入门综述、基础)
- 一、python爬虫程序入门(图片下载)
- Python爬虫入门实战一
- 爬虫入门(一)
- (一)爬虫入门
- 我的Python入门学习(一):网络刷博器爬虫
- Python爬虫开发(一):零基础入门
- Python爬虫开发(一):零基础入门
- Python入门(一):爬虫基本结构&简单实例
- python爬虫入门 实战(一)---爬糗事百科
- HTML5本地存储——IndexedDB(一:基本使用)
- Catch That Cow POJ - 3278
- 部分和问题
- 1023. 组个最小数 (20)
- C++概述(一)
- python爬虫入门(一)
- ios 生成IPA文件
- noip2016练习题(2.区间)
- 机器学习笔记 - 性能度量
- 基础练习 高精度加法
- weka学习[1]_Eclipse中读取arff文件
- C++员工管理小程序
- 【PAT】1059. Prime Factors
- HTML5本地存储——IndexedDB(二:索引)