python网络爬虫-API调用至服务器响应

来源:互联网 发布:php可以编译吗 编辑:程序博客网 时间:2024/06/10 19:33

       API有一个重要的特征是它们会反馈格式友好的数据。大多数反馈的数据格式都是XML和JSON。这几年JSON比XML更受欢迎,主要有两个原因。首先,JSON文件比完整的XML格式小。比如XML数据要用98个字符,同样的JSON格式数据只要用73个字符,比描述同样内容的XML文件小36%。

       JSON格式比 XML格式更受欢迎的另一个原因是网络技术的改变。过去,服务器端用PHP和.NET这些程序作为API的接收端。现在服务器端也会用JavaScript框架作为API的发送和接收端,向Angular或BackBone等。虽然服务器的技术无法预测它们即将收到的数据格式,但是像BackBone之类的JavaScript库处理JSON比处理XML要更简单。

API调用

      不同API的调用语法不太相同,但是有几条共同准则。当使用GET请求获取数据时,用URL路径描述你要获取的数据范围,查询参数可以作为过滤器或附加请求使用。例如,下面这个虚拟的API,可以获取ID是1234的用户在2014年8月份的所有博文:

http://socialmediasite.com/users/1234/posts?from=08012014&to=08312014

       有许多API会通过文件路径(path)的形式指定API版本、数据格式和其他属性。例如,下面的链接会返回同样的结果,但是使用虚拟的API的第四版,反馈数据为JSON格式:

http://socialmediasite.com/api/v4/users/1234/posts?from=08012014&to=08312014

      还有一些API会通过请求参数(request parameter)的形式指定数据格式和API版本。

  http://socialmediasite.com/users/1234/posts?format=json&from=08012014&to=08312014