python学习笔记(五):正则表达式

来源:互联网 发布:淘宝免费代收货服务 编辑:程序博客网 时间:2024/05/22 13:28

正则表达式:
1.正则表达式的库文件:re
2.正则表达式的方法:findall,search,sub
findall(寻找的值,对象),返回一个列表
3.换行
这里写图片描述
4.匹配数字
这里写图片描述

  1. 网页爬虫(半自动)
    这里写图片描述

  2. 提取网页源代码
    这里写图片描述
    这里写图片描述
    7.向网页提交数据
    这里写图片描述
    这里写图片描述
    这里写图片描述
    这里写图片描述

  3. XPath
    这里写图片描述
    这里写图片描述
    获取神奇符号的方法:右击源代码,选择copy xpath
    这里写图片描述
    这里写图片描述
    这里写图片描述
    这里写图片描述
    这里写图片描述
    这里写图片描述
    9.python的并行化多线程操作
    (python中开源爬虫框架scrapy自带更高效率的并行化多线程技术,这里map可初步了解)
    这里写图片描述
    这里写图片描述
0 0
原创粉丝点击