Python网络爬虫(一):初步了解

来源:互联网 发布:sql from() 编辑:程序博客网 时间:2024/04/27 22:34
实际的软件开发=调用各种现成的库


Python可以干嘛?
1.网络应用,如网站、后台服务等——web
2.小工具,脚本——爬虫
3.实现对其他语言程序的包装和连接,胶水语言


Python的不足:
作为一种解释性语言,
1.运行起来比C慢;
2.代码无法加密,只能发布源代码,无法像C一样发布.exe。


爬虫:

1.基本原理是什么

通过url获得网页的html信息-->调用库函数从html信息中将想要的部分内容筛选、保存下来

2.模块安装:要安装哪些东西

3.简单的实现

很棒的一个教程:http://blog.csdn.net/c406495762/article/details/78123502

原创粉丝点击