python爬虫入门（一）

来源：互联网发布：新闻文章网站源码编辑：程序博客网时间：2024/05/22 17:14

今天有个朋友问我，你能不能帮我写个能下载一个网页上所有图片的脚本呀？我一想，刚好最近在学python，学到了URL这一块，就尝试着写了几个简单的脚本练了练手。其实自己也只是试了试 urllib2 这个模块确实是很强大的功能，简单的贴几行今天写的小代码（认真脸# 。#）

import urllib2,sysresponse = urllib2.urlopen('http://www.baidu.com/')html = response.read()fp = open("/home/ubuntu/python/file/baidu.txt","w")fp.write(html)fp.close()print html

这里直接将百度首页的所有代码保存下来，存到 *baidu.txt，同时打印www.baidu.com HTML 内容。

0 0

python爬虫入门（一）
python 入门爬虫（一）
Python 爬虫入门(一）
Python爬虫入门一
Python爬虫入门一
Python爬虫入门 (一)
Python爬虫总结（一）入门
Python爬虫入门（一）写在前面
Python爬虫一（入门综述、基础）
一、python爬虫程序入门（图片下载）
Python爬虫入门实战一
爬虫入门（一）
（一）爬虫入门
我的Python入门学习（一）：网络刷博器爬虫
Python爬虫开发（一）：零基础入门
Python爬虫开发（一）：零基础入门
Python入门（一）：爬虫基本结构&简单实例
python爬虫入门实战（一）---爬糗事百科
HTML5本地存储——IndexedDB（一：基本使用）
Catch That Cow POJ - 3278
部分和问题
1023. 组个最小数 (20)
C++概述（一）
python爬虫入门（一）
ios 生成IPA文件
noip2016练习题（2.区间）
机器学习笔记 - 性能度量
基础练习高精度加法
weka学习[1]_Eclipse中读取arff文件
C++员工管理小程序
【PAT】1059. Prime Factors
HTML5本地存储——IndexedDB（二：索引）