qq音乐专辑封面 api

来源:互联网 发布:seo优化培训 编辑:程序博客网 时间:2024/04/30 02:47

    因为好奇,打算从qq音乐http://y.qq.com/#type=index  抓取它的专辑封面http://y.qq.com/#type=album&index= ,不得不佩服qq产品做的都很精细,专辑封面都是非常

的全,而且清晰度还不错。

    本来准备分析qq音乐专辑页面,这样只要解析一下html文件,就可以找出专辑了(以前抓取人人好友相册的时候就是这么干的)。不过保存网页分析之后,找不到专辑信息,原来是iframe的原因,网页嵌套网页,后面还有一堆js代码。网上搜了一下关于python如何解析iframe,但是没有成功,就用chrome自带的开发人员工具或者点这里分析 访问http://y.qq.com/#type=album&index= 产生的所有交互。

    重点分析Network标签就行了,里面有一个fcg_album_list.fcg, 



http://sns.music.qq.com/fcgi-bin/albumlist/fcg_album_list.fcg?inter=0&lang=0&type=0&index=0&quality=0&sort=1&pagenum=1&pagesize=30&otype=json&callback=MusicJsonCallback&_=0.316674429923296&g_tk=5381 

    上面的url就是第1页的专辑,返回类型是json格式,整理一下 就可以得到这样的api

    http://sns.music.qq.com/fcgi-bin/albumlist/fcg_album_list.fcg?inter=0&lang=0&type=0&index=0&quality=0&sort=1&pagesize=30&otype=json&pagenum=第几页

    同样的,获取每个专辑的信息api(比如说专辑的歌手,专辑歌曲列表)也可以通过开发人员工具进行跟踪分析,我得到的api是(基本上都是对专辑id取模100)

http://music.qq.com/midportal/static/album/专辑id%100/album_专辑id.js 

    从中分析出相册的封面地址:

http://imgcache.qq.com/music/photo/album/专辑id%100/albumpic_专辑id_0.jpg

    但是这个api有时候不好使。估计是因为没有高清的,可以试试这个api

http://imgcache.qq.com/music/photo/album_300/专辑id%100/300_albumpic_专辑id_0.jpg

    这儿也有对qq音乐抓取的讨论,可以参考一下  http://www.cocoachina.com/bbs/read.php?tid=115028


    如果知道python如何处理iframe,请告诉我一声啊,谢谢啦