crawler httpclient 爬 sohu 搜狐部分页面数据

来源:互联网 发布:php sig dfl 编辑:程序博客网 时间:2024/06/06 09:52

因为sohu部分页面内容返回格式为 gzip,所以在得到返回结果的是要判断此内容,再进行对内容的解析。

 

下面是以sohu主页的数据

 

 

下面是访问sohu主页时服务器返回的响应及其头信息: