【实战\聚焦Python分布式爬虫必学框架Scrapy 打造搜索引擎项目笔记】第3章 爬虫基础知识回顾

来源:互联网 发布:感恩安全座椅 知乎 编辑:程序博客网 时间:2024/06/07 05:49

目录:第3章爬虫基础知识回顾

  • 3-1 技术选型 爬虫能做什么 (09:50) 
  • 3-2 正则表达式-1 (18:31)
  • 3-3 正则表达式-2 (19:04)
  • 3-4 正则表达式-3 (20:16)
  • 3-5 深度优先和广度优先原理 (25:15)
  • 3-6 url去重方法 (07:44)
  • 3-7 彻底搞清楚unicode和utf8编码 (18:31)

笔记:










阅读全文
0 0