正则表达式截取URL参数

来源:互联网 发布:布兰诗歌 知乎 编辑:程序博客网 时间:2024/06/05 11:56

最近在写个爬虫,要去爬一些网站获得数据,这个过程中遇到字符串截取的问题,超哥指点了我,帮了个大忙啊

http://regexpal.com/还有http://www.regexr.com/这两个网站可以测试你的正则表达式~

除此之外,谷歌浏览器的开发者工具也很好用,F12后在console里面可以直接进行操作

例如:http://market.scau.edu.cn/goods.php?iid=1407246132s7jn1j8b&iaction=view&st=0f 这样一个字符串,我要取得 iid

   在console里面输入 var item =" http://market.scau.edu.cn/goods.php?iid=1407246132s7jn1j8b&iaction=view&st=0f"

          item.match(/iid=([0-9a-z]+)&iaction=(\w+)&st=(\w+)/)

     会返回 ["iid=1407246132s7jn1j8b&iaction=view&st=0f","1407246132s7jn1j8b","view","0f"] 这样一个数组

利用捕获可以简单方便得获得想要的字符。



0 0