根据电影名称,获取下载链接
来源:互联网 发布:软件c 编程代码 编辑:程序博客网 时间:2024/05/16 05:15
做个笔记
# -*- coding: utf-8 -*-import urllibimport sysimport urllib2from bs4 import BeautifulSoupimport rereload(sys)sys.setdefaultencoding("utf-8")#访问url,返回html页面def get_html(url): req=urllib2.Request(url) req.add_header('User-Agent','Mozilla/5.0') response=urllib2.urlopen(url) html=response.read() return htmldef get_movie_url(movie_name):#根据名称,返回下载地址 host_url = 'http://s.dydytt.net/plus/search.php?kwtype=0&keyword=' movie_sign = urllib.quote(movie_name.decode('utf-8').encode('gbk')) movie_url = host_url+movie_sign search_result = get_movie_list(movie_url) return movie_url#从搜索结果页面,获取电影的urldef get_movie_list(url): m_list = [] html = get_html(url) soup = BeautifulSoup(html,'html.parser') fixed_html=soup.prettify() a_urls = soup.find_all('a') host = "http://www.ygdy8.com" for a_url in a_urls: m_url = a_url.get('href') if re.search(r'\d{8}',m_url): m_list.append(host+m_url) return m_list#从电影详情页面中获取电影标题def get_movie_title(html): soup=BeautifulSoup(html,'html.parser') fixed_html=soup.prettify() title=soup.find('h1') title=title.string return title#从电影详情页面中获取视频下载地址def get_movie_download_url(html): soup=BeautifulSoup(html,'html.parser') fixed_html=soup.prettify() td=soup.find('td',attrs={'style':'WORD-WRAP: break-word'}) url_a=td.find('a') url_a=url_a.string return url_a#传入电影列表,获取每个电影的下载地址def get_movie(movie_list): for i in range(0,len(movie_list)): #for url in movie_list: html = get_html(movie_list[i]) html = html.decode('GBK') m_title = get_movie_title(html) m_url = get_movie_download_url(html) print i+1,"--",m_title print m_url print "--"*50if __name__ == "__main__": movie_name = '悟空传'#搜索电影的名称 movie_list = get_movie_list(get_movie_url(movie_name)) get_movie(movie_list)
阅读全文
0 0
- 根据电影名称,获取下载链接
- 根据文件下载链接地址获取文件的大小
- 根据URL链接下载文件
- WordPress: 根据分类别名获取分类链接
- WordPress: 根据分类别名获取分类链接
- 如何根据URL链接获取网页标题
- 根据网页链接获取网页标题
- Android 获取下载链接文件大小
- 工具类:根据URL获取短链接,根据短链接获取真实URL
- js 根据路径获取下载路径和下载文件名
- 怎样获取网页视频下载链接
- qt url下载链接 获取文件名
- 获取网络上歌曲下载链接
- 七牛-获取下载链接(java)
- 百度云获取下载链接代码。
- Python多线程爬虫获取电影下载链接
- 获取myeclipse下载链接 &&www.genuitec.com
- qt url下载链接 获取文件名
- NGS基础名词解释(1)
- Android图形显示系统——下层显示4:图层合成下(硬件合成器)
- 返回顶部效果!
- 【Struts2】1.类型转换和输入校验
- vue省市区三级联动mysql,js/json,html/jsp
- 根据电影名称,获取下载链接
- xargs命令详解,xargs与管道的区别
- Android---使用BottomTabBar实现底部导航页
- VueJS学习笔记
- Spring+SpringMVC+Mybatis+Maven+MySql框架搭建与分页实例
- request.getParameter() 和request.getAttribute() 区别
- 一个简单的input离焦事件验证
- postgresql 查看wal生成频率和大小
- ext使用