python使用正则表达式解析http url

来源:互联网 发布:dhcp 端口号43端口号 编辑:程序博客网 时间:2024/06/05 19:10

http Get的原文
/alter?user=abcde&pwd=123456

re.compile(r'/(?P<url_path>alter)\?(?P<query>user=(?P<user>[a-zA-Z]{5,10})&pwd=(?P<passwd>(?:\d|\w){6,}?))$')
  • step1
(?P<url_path>alter)

找到匹配的http path( alter ),同时命名为url_path

  • step2
(?P<query>user=(?P<user>[a-zA-Z]{5,10})&pwd=(?P<passwd>(?:\d|\w){6,}?))

匹配query-string .并命名为query

  • step3
user=(?P<user>[a-zA-Z]{5,10})

匹配user

  • step4
pwd=(?P<passwd>(?:\d|\w){6,}?)

匹配pwd,其中?为非贪婪模式.

运行结果:

>>> p=re.compile(r'/(?P<url_path>alter)\?(?P<query>user=(?P<user>[a-zA-Z]{5,10})&pwd=(?P<passwd>(?:\d|\w){6,}?))$')>>> p.match('/alter?user=liujxc&pwd=123456').groups()('alter', 'user=liujxc&pwd=123456', 'liujxc', '123456')
0 0
原创粉丝点击