如何爬取国外网站

来源:互联网 发布:2016欧洲杯c罗数据 编辑:程序博客网 时间:2024/05/05 22:48

一、首先通过程序抓取国内可用的代理

        这里可用的国内代理主要参考博客:http://blog.csdn.net/u011781521/article/details/70194744

二、通过vpn或者shadowsocks代理

        使用方式参见博客:http://blog.csdn.net/u011781521/article/details/70194744

   这里个人觉得使用shadowssocks代理比较好(推荐1024程序员加速器,价格公道绝非打广告),因为这里只需要使               用本地的IP和端口号比较方便形如:

          127.0.0.1:1080
      当然你也可以使用HTTP Basic Authentication_认证的代理这里个人感觉比较麻烦没有实现,具体可以参见博客:
       http://www.cnblogs.com/rwxwsblog/p/4575894.html