菜鸟成长记-----用python写一个简单的小爬虫
来源:互联网 发布:苹果手机备份软件 编辑:程序博客网 时间:2024/05/16 06:33
小白突发奇想想来搞一搞之前的课设,于是下了个python编辑器Pycharm写个爬虫耍一耍,这里权且记下来供后人(也就是小白自己拉)参考。
Pthon3中urllib2等几个库被整合了一下,所以在调用urlopen函数的时候就不能在通过urllib库调用了,需要引入urllib.request库让后通过这个库进行调用,之后通过这个库调用这个函数就行了,就像这样
page = urllib.request.urlopen(url)
这样我们就创建了一个远程类文件对象page,通过调用read函数可以读取到网页内的源码,对于这些源码可以把他们写在txt文件中,输入文件参数的时候稍微注意一下路径中“\”和“/”,方式设置为“wb+”表示用二进制打开输入,这样一个简答的小爬虫就做好了,了了数行代码如下:
import urllib.requesturl = "http://www.view.sdu.edu.cn/"page = urllib.request.urlopen(url)html = page.read()file = open("搜索引擎\\test.txt","wb+")file.write(html)
阅读全文
0 0
- 菜鸟成长记-----用python写一个简单的小爬虫
- 用Python写一个简单的爬虫
- 用python写一个简单的爬虫功能
- 用Python写一个简单的爬虫功能
- 用python写一个简单的爬虫功能
- 用Python写一个简单的微博爬虫
- python一个简单的小爬虫
- python写爬虫1-写一个简单爬虫
- Hello Python!用python写一个抓取CSDN博客文章的简单爬虫
- python 特别简单的一个小爬虫(看着玩吧 )
- 用Python写简单爬虫
- 小菜鸟成长记
- 用python写的一个简单的爬取湖州天气的爬虫
- 用python写一个简单的爬虫保存在json文件中
- 一个简单的Python爬虫
- 用python写了个小的爬虫程序
- Python写的deviantArt小爬虫
- [Python]网络爬虫(六):一个简单的百度贴吧的小爬虫
- Live555源码解析(3)
- 如何--关闭/开启--Oracle 10g数据库
- Linux用户空间与内核空间内存映射
- 负载均衡
- 命令行 或者 桌面启动ubuntu
- 菜鸟成长记-----用python写一个简单的小爬虫
- ajAx与springmvc之间交互
- openstack plugin 之(二)怎样写 OpenStack Neutron 的 Plugin
- Oracle 12C容器数据库(CDB)和插拔数据库(PDB)的创建(一)
- ContentObser实例
- Mysql 设置时间自动生成
- java,你真的理解,=赋值的含义吗?
- erlang vim 插件安装
- Android开发中的那些坑之-------------string.xml里面的通配符