精通Python网络爬虫-书籍介绍
来源:互联网 发布:linux tail命令 编辑:程序博客网 时间:2024/05/18 02:03
内容简介
本书从技术、工具与实战3个维度讲解了Python网络爬虫:
技术维度:详细讲解了Python网络爬虫实现的核心技术,包括网络爬虫的工作原理、如何用urllib库编写网络爬虫、爬虫的异常处理、正则表达式、爬虫中Cookie的使用、爬虫的浏览器伪装技术、定向爬取技术、反爬虫技术,以及如何自己动手编写网络爬虫;
工具维度:以流行的Python网络爬虫框架Scrapy为对象,详细讲解了Scrapy的功能使用、高级技巧、架构设计、实现原理,以及如何通过Scrapy来更便捷、高效地编写网络爬虫;
实战维度:以实战为导向,是本书的主旨,除了完全通过手动编程实现网络爬虫和通过Scrapy框架实现网络爬虫的实战案例以外,本书还有博客爬取、图片爬取、模拟登录等多个综合性的网络爬虫实践案例。
作者在Python领域有非常深厚的积累,不仅精通Python网络爬虫,在Python机器学习、Python数据分析与挖掘、Python Web开发等多个领域都有丰富的实战经验
作者简介
韦玮
资深网络爬虫技术专家、大数据专家和软件开发工程师,从事大型软件开发与技术服务多年,现任重庆韬翔网络科技有限公司创始人兼CEO,国家专利发明人。
精通Python技术,在Python网络爬虫、Python机器学习、Python数据分析与挖掘、Python Web开发等多个领域都有丰富的实战经验。
CSDN、51CTO、天善智能等科技类社区和媒体的特邀专家和讲师,输出了大量的高质量课程和文章,深受用户喜爱。
微博:http://weibo.com/qiansyy媒体评论
网络爬虫是互联网上进行信息采集的通用手段,在互联网的各个专业方向上都是不可或缺的底层技术支撑。本书从爬虫基础开始,全面阐述了Python网络爬虫技术,并且包含各种经典的网络爬虫项目案例,特别是详细给出了基于Scapy框架实现网络爬虫的*实践方案与流程,实战性非常强,是一本关于Python网络爬虫的优秀实战书籍,值得推荐。
——诸葛建伟 清华大学副研究员/《Metasploit渗透测试魔鬼训练营》作者
本书详细讲解了如何基于Python从零开始构建一个成熟的网络爬虫解决方案的完整过程,以及业界主流爬虫技术的原理与实战案例,同时也引入了作者个人的经验与思考,非常有价值。本书循序渐进的内容组织结构,相信无论是新手还是老手,均能很好地阅读和吸收。
——刘天斯 腾讯高级工程师,《Python自动化运维》作者
——诸葛建伟 清华大学副研究员/《Metasploit渗透测试魔鬼训练营》作者
本书详细讲解了如何基于Python从零开始构建一个成熟的网络爬虫解决方案的完整过程,以及业界主流爬虫技术的原理与实战案例,同时也引入了作者个人的经验与思考,非常有价值。本书循序渐进的内容组织结构,相信无论是新手还是老手,均能很好地阅读和吸收。
——刘天斯 腾讯高级工程师,《Python自动化运维》作者
3 0
- 精通Python网络爬虫-书籍介绍
- 精通python网络爬虫笔记一
- 精通python网络爬虫学习笔记(1)
- Python网络爬虫2 ---- scrapy爬虫架构介绍和初试
- 网络编程书籍介绍
- 网络爬虫技术介绍
- 网络爬虫的介绍
- 网络爬虫 介绍
- 网络爬虫介绍
- 网络爬虫介绍
- Python爬虫介绍
- python爬虫介绍
- Python爬虫介绍
- python 爬虫介绍
- python 网络爬虫代码
- Python实现网络爬虫
- Python实现网络爬虫
- Python实现网络爬虫
- 对象及内存管理——final修饰符
- MNIST手写字识别的TensorFlow实现
- Machine Learning第二讲[多变量线性回归] --(一)多变量线性回归
- 欢迎使用CSDN-markdown编辑器
- 八皇后问题
- 精通Python网络爬虫-书籍介绍
- 将十进制的各个位数分离出来
- Unity编程笔记----多语言切换
- 比特币区块结构解析
- MATLAB深度学习CNN包的代码详解补充及各变量参数说明
- C语言——指针的运算
- 系统延迟及定时
- ES6中 字符串中扩展 的方法
- dicom文件与bmp和jpg文件的相互转化