获取罗辑思维每天的微信语音(python)

来源:互联网 发布:应用市场软件 编辑:程序博客网 时间:2024/05/16 17:46

获取罗辑思维每天的微信语音(python)

by 伍雪颖

一直喜欢听罗辑思维,不过每天去点那个微信的公众号好麻烦,而且每天听一分钟也不太爽,于是今天突然想把它们全pa下来,合并起来,找时间一次全听完不更好.
于是,开动:
上网找了下,发现已经有一个网站有mp3,于是去爬它的数据(也可以直接去爬罗辑思维官网的数据http://www.ljsw.cc)
http://www.ljsw.cc/forum-39-1.html
获取title和mp3的url:
#coding=utf-8
import re,urllib2

f = file(
'luoji.txt','w')

def getHtmlCode(url):
   
return urllib2.urlopen(url).read()

def getTitle(htmlString):
    regTitle = re.compile(
"xst\">(.+?) ")
       
returnregTitle.findall(htmlString)

def getMp3Url(htmlString):
    regMp3 = re.compile(
"http(.+?).mp3\'")
       
returnregMp3.findall(htmlString)

def getLuojiContent(url):
    htmlCode = getHtmlCode(url)
        titles = getTitle(htmlCode)
        urls = getUrl(htmlCode)
       
for i in range(0,len(urls)):
           
printtitles[i]
                f.write(titles[i] +
'-')
                contentHtml = getHtmlCode(urls[i])
                contents = getMp3Url(contentHtml)
               
iflen(contents) > 0:
                    mp3Url =
'http' + contents[0] +'.mp3'
                       
print mp3Url
                        f.write(mp3Url +
'\n')


if __name__ == '__main__':
   
for i in range(1,38):
       
printstr(i)
            url =
'http://www.ljsw.cc/forum-39-'+ str(i) + '.html'
            
try:
                getLuojiContent(url)
                
print'finished: ' + str(i)
            
except:
                
printstr(i) + ': error!'

下载mp3文件:
#coding=utf-8
import re,urllib2,os

for line in open("luoji.txt"):
    contents = line.split(
'-')
        url = line[
11:len(line)-1]
        cmd =
'curl -O "%s"'% (url)
        os.system(cmd)
        fileName = url.split(
'/')
        name = fileName[len(fileName) -
1]
        os.rename(name,contents[
0] +'.mp3')

合并mp3文件:
from glob import iglob
import shutil
import os

PATH = r
'mp3'
destination = open(
'luoji.mp3','wb')
for filename in iglob(os.path.join(PATH, '*.mp3')):
    shutil.copyfileobj(open(filename,
'rb'), destination)
destination.close()

搞定,于是可以一个个听,也可以合起来听


所有python代码:
github代码

所有mp3文件:
链接: http://pan.baidu.com/s/1nt5L7Pf 密码: 5mrg

2 0
原创粉丝点击
热门问题 老师的惩罚 人脸识别 我在镇武司摸鱼那些年 重生之率土为王 我在大康的咸鱼生活 盘龙之生命进化 天生仙种 凡人之先天五行 春回大明朝 姑娘不必设防,我是瞎子 护照期限到期了怎么办 签证超出停留期怎么办 签证快过期了怎么办 去国外旅游签证怎么办 照片回执过期了怎么办 加拿大护照丢了怎么办 头发有颜色怎么办护照 微信怎么办港澳通行证 港澳通行证 团签怎么办 出境章没有盖怎么办 过海关没有盖章怎么办 中国入境没盖章怎么办 护照有效期写错怎么办 回国海关电子盖章怎么办 户籍在学校怎么办护照 割过双眼皮护照怎么办 想换电子护照怎么办 有美签的护照丢失怎么办 护照在国外掉了怎么办 上海动迁房户口怎么办 政府强制拆房怎么办 农村无证宅基地怎么办 身份证没磁怎么办护照 买安置房怎么办产权 安置房房东违约怎么办 安置房产权到期怎么办 安置房怎么办房产证吗 美甲后指甲长了怎么办 在菲律宾怎么办持枪证? 绝地求生打不准怎么办 身份证号码变更后社保怎么办 社保与身份不符怎么办 年龄改了学籍怎么办 结婚证信息错误怎么办 六级身份证过期怎么办 身份号泄露了怎么办 身体证信息泄露怎么办 手机号被泄漏了怎么办 姓名和电话泄露怎么办 个人身份证信息泄露怎么办 身份号码泄露了怎么办