获取罗辑思维每天的微信语音(python)
来源:互联网 发布:应用市场软件 编辑:程序博客网 时间:2024/05/16 17:46
获取罗辑思维每天的微信语音(python)
by 伍雪颖
一直喜欢听罗辑思维,不过每天去点那个微信的公众号好麻烦,而且每天听一分钟也不太爽,于是今天突然想把它们全pa下来,合并起来,找时间一次全听完不更好.
于是,开动:
上网找了下,发现已经有一个网站有mp3,于是去爬它的数据(也可以直接去爬罗辑思维官网的数据http://www.ljsw.cc)
http://www.ljsw.cc/forum-39-1.html
获取title和mp3的url:
#coding=utf-8
import re,urllib2
f = file('luoji.txt','w')
def getHtmlCode(url):
return urllib2.urlopen(url).read()
def getTitle(htmlString):
regTitle = re.compile("xst\">(.+?) ")
returnregTitle.findall(htmlString)
def getMp3Url(htmlString):
regMp3 = re.compile("http(.+?).mp3\'")
returnregMp3.findall(htmlString)
def getLuojiContent(url):
htmlCode = getHtmlCode(url)
titles = getTitle(htmlCode)
urls = getUrl(htmlCode)
for i in range(0,len(urls)):
printtitles[i]
f.write(titles[i] + '-')
contentHtml = getHtmlCode(urls[i])
contents = getMp3Url(contentHtml)
iflen(contents) > 0:
mp3Url = 'http' + contents[0] +'.mp3'
print mp3Url
f.write(mp3Url + '\n')
if __name__ == '__main__':
for i in range(1,38):
printstr(i)
url = 'http://www.ljsw.cc/forum-39-'+ str(i) + '.html'
try:
getLuojiContent(url)
print'finished: ' + str(i)
except:
printstr(i) + ': error!'
import re,urllib2
f = file('luoji.txt','w')
def getHtmlCode(url):
return urllib2.urlopen(url).read()
def getTitle(htmlString):
regTitle = re.compile("xst\">(.+?) ")
returnregTitle.findall(htmlString)
def getMp3Url(htmlString):
regMp3 = re.compile("http(.+?).mp3\'")
returnregMp3.findall(htmlString)
def getLuojiContent(url):
htmlCode = getHtmlCode(url)
titles = getTitle(htmlCode)
urls = getUrl(htmlCode)
for i in range(0,len(urls)):
printtitles[i]
f.write(titles[i] + '-')
contentHtml = getHtmlCode(urls[i])
contents = getMp3Url(contentHtml)
iflen(contents) > 0:
mp3Url = 'http' + contents[0] +'.mp3'
print mp3Url
f.write(mp3Url + '\n')
if __name__ == '__main__':
for i in range(1,38):
printstr(i)
url = 'http://www.ljsw.cc/forum-39-'+ str(i) + '.html'
try:
getLuojiContent(url)
print'finished: ' + str(i)
except:
printstr(i) + ': error!'
下载mp3文件:
#coding=utf-8
import re,urllib2,os
for line in open("luoji.txt"):
contents = line.split('-')
url = line[11:len(line)-1]
cmd = 'curl -O "%s"'% (url)
os.system(cmd)
fileName = url.split('/')
name = fileName[len(fileName) - 1]
os.rename(name,contents[0] +'.mp3')
import re,urllib2,os
for line in open("luoji.txt"):
contents = line.split('-')
url = line[11:len(line)-1]
cmd = 'curl -O "%s"'% (url)
os.system(cmd)
fileName = url.split('/')
name = fileName[len(fileName) - 1]
os.rename(name,contents[0] +'.mp3')
合并mp3文件:
from glob import iglob
import shutil
import os
PATH = r'mp3'
destination = open('luoji.mp3','wb')
for filename in iglob(os.path.join(PATH, '*.mp3')):
shutil.copyfileobj(open(filename, 'rb'), destination)
import shutil
import os
PATH = r'mp3'
destination = open('luoji.mp3','wb')
for filename in iglob(os.path.join(PATH, '*.mp3')):
shutil.copyfileobj(open(filename, 'rb'), destination)
destination.close()
搞定,于是可以一个个听,也可以合起来听
所有python代码:
github代码
所有mp3文件:
链接: http://pan.baidu.com/s/1nt5L7Pf 密码: 5mrg
2 0
- 获取罗辑思维每天的微信语音(python)
- 如何转发微信5.0的语音
- 微信语音idk的demo学习
- 微信语音连播的实现思路
- 微信语音
- 微信语音
- 微信语音上传下载
- 微信思维
- python 获取管理微信应用菜单
- 用python批量获取微信头像
- python获取微信用户基本信息
- 微信语音点歌系统
- 微信语音保存新方法
- Android 微信语音功能
- Java微信语音开发
- 微信语音功能开发
- iPhone微信语音导出
- 微信语音speex转换
- RabbitMQ使用实践
- Leetcode --Sudoku Solver
- oracle官方文档之V$SESSION
- Linux如何查看so中函数名
- CentOS 7中没有ifconfig命令,而且不能发现eth0
- 获取罗辑思维每天的微信语音(python)
- C语言及程序设计初步例程-40 穷举法解题
- hdu 3530 Subsequence(dp单调队列优化)
- 【SzNOI语法百题】【d006】 交换两数值
- 让label 始终在Form的正中显示
- javafX初探(单选按钮)
- cocos2d-x---ttf字体 和 fnt字体 的显示
- Objective-c 中的Category和Extension
- EditingSupport 对TreeViewer和TableViewer的编辑功能的支持