根据电影名称,获取下载链接

来源:互联网 发布:软件c 编程代码 编辑:程序博客网 时间:2024/05/16 05:15

做个笔记

# -*- coding: utf-8 -*-import urllibimport sysimport urllib2from bs4 import BeautifulSoupimport rereload(sys)sys.setdefaultencoding("utf-8")#访问url,返回html页面def get_html(url):    req=urllib2.Request(url)    req.add_header('User-Agent','Mozilla/5.0')    response=urllib2.urlopen(url)    html=response.read()    return htmldef get_movie_url(movie_name):#根据名称,返回下载地址    host_url = 'http://s.dydytt.net/plus/search.php?kwtype=0&keyword='    movie_sign = urllib.quote(movie_name.decode('utf-8').encode('gbk'))    movie_url = host_url+movie_sign    search_result = get_movie_list(movie_url)    return movie_url#从搜索结果页面,获取电影的urldef get_movie_list(url):    m_list = []    html = get_html(url)    soup = BeautifulSoup(html,'html.parser')    fixed_html=soup.prettify()    a_urls = soup.find_all('a')    host = "http://www.ygdy8.com"    for a_url in a_urls:        m_url = a_url.get('href')        if re.search(r'\d{8}',m_url):            m_list.append(host+m_url)    return m_list#从电影详情页面中获取电影标题def get_movie_title(html):    soup=BeautifulSoup(html,'html.parser')    fixed_html=soup.prettify()    title=soup.find('h1')    title=title.string    return title#从电影详情页面中获取视频下载地址def get_movie_download_url(html):    soup=BeautifulSoup(html,'html.parser')    fixed_html=soup.prettify()    td=soup.find('td',attrs={'style':'WORD-WRAP: break-word'})    url_a=td.find('a')    url_a=url_a.string    return url_a#传入电影列表,获取每个电影的下载地址def get_movie(movie_list):    for i in range(0,len(movie_list)):    #for url in movie_list:        html = get_html(movie_list[i])        html = html.decode('GBK')        m_title = get_movie_title(html)        m_url = get_movie_download_url(html)        print i+1,"--",m_title        print m_url        print "--"*50if __name__ == "__main__":    movie_name = '悟空传'#搜索电影的名称    movie_list = get_movie_list(get_movie_url(movie_name))    get_movie(movie_list)

这里写图片描述

原创粉丝点击
热门问题 老师的惩罚 人脸识别 我在镇武司摸鱼那些年 重生之率土为王 我在大康的咸鱼生活 盘龙之生命进化 天生仙种 凡人之先天五行 春回大明朝 姑娘不必设防,我是瞎子 育碧账号忘了怎么办 uplay八折券丢了怎么办 不小心按到了育碧解绑怎么办 台式电脑连不上网怎么办 重装系统也安装不了cad怎么办 染发灰色偏绿了怎么办 vgm数据填错了怎么办 克里格插值 不符合正态分布怎么办 克里金插值无效的输出范围怎么办 穿完臭袜子要洗手吗不洗怎么办 超敏c反应蛋白117怎么办 钢铁雄心4无模板怎么办 登录 新浪微博登录异常怎么办 微博授权失败怎么办qq uc微博授权失败怎么办 苹果手机无线网坏了怎么办 小米手机wife信号不好怎么办 微博出错了c403怎么办 微信客服没人接怎么办 安装包解析错误怎么办平板 苹果手机新浪免费邮箱用不了怎么办 苹果手机老是弹跳邮箱登陆怎么办 qq长时间不登录上不了怎么办 父母不会说英语怎么办英国签证 美军舰真来台湾怎么办 现役军人回家探亲和人打架怎么办 对四六不懂的人怎么办 赌球小2.5进3球怎么办 皮肤旧伤黑色斑怎么办 小米5c网络不好怎么办 小米去5c卡怎么办 戴尔游匣5577开机黑屏怎么办 三星s6的通知栏拉不下来怎么办 电脑记住密码打不开了怎么办 联想手机升级系统失败了怎么办 日本语言学校申请研究生签证怎么办 在埃塞俄比亚签证过期了怎么办 看完的小说想要卖掉该怎么办 在俄罗斯脸干了痛怎么办 苹果手表电池放亏了怎么办 平板电脑电池不耐用怎么办