python中模拟浏览器的方法和思路

来源:互联网 发布:淘宝网阿迪达斯鞋 编辑:程序博客网 时间:2024/06/06 05:54
 两种思路三种方法:
  1. 用PAMIE。建议不要使用,因为PAMIE为个人开发,里面的bug比较多,而且是直接使用win32com方式的,如果IE不小心修改了,后果很严重。另外,PAMIE3使用的是Python3,这个在Python世界中支持的不太好。
  2. 用selenium RC。这个东东很好,如果用这个东东完成网页自动测试不错,支持多种浏览器,而且是公司开发的,上手难易程度类似PAMIE。只不过需要打开浏览器,这个就看大家的需要了。
  3. 用Mechanize和Beautiful Soup。这个东东是在urllib2的基础上向上开发的,是个好工具。IBM介绍使用Mechanize的文章
        Python中访问网页实际上存在两种思路,一种是利用现成的浏览器访问网页,这种方式的优点是可以利用浏览器处理复杂的javascript的内容,避免自己受苦受累。经常看到有人问如何点击网页等等的需求,那么利用浏览器来实现就是一个好思路了。1,2均是这种思路,不过使用范围是网站自动测试。当然自己写一个访问某某网页的东东也不错。
       另外的思路就是利用urllib2来访问网页了。说实在话,选择python的理由有两个:google在用,另外它访问网页和正则表达式的方法让我很喜欢。最后的理由就是她是一个高生产力语言,用C写上200行代码可能用python写5行不到。
使用python的另外的好处是资源相对比较多,要解决一个问题,耐心的查找一下,总能发现好的资源。
原创粉丝点击