千里码之爬虫-1
来源:互联网 发布:天龙八部自动祝福软件 编辑:程序博客网 时间:2024/04/29 08:53
豆瓣电影top250收录了至今为止,大家最最最喜欢的250部电影。
该列表呈现了每部电影的评分,年份等基本信息。
这题的答案很简单,我想知道这个榜单的前166部电影的评分总和。
举例::目前排第一的肖申克的救赎 9.6分,第二的这个杀手不太冷 9.4分,第三的阿甘正传 9.4分。前3部电影的总分=9.6+9.4+9.4=28.4。
地址:http://www.qlcoder.com/task/7560。
<?phpdefine('STEP', '25');$url = 'https://movie.douban.com/top250'; function curl_request($url){ $curl = curl_init(); curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, false); curl_setopt($curl, CURLOPT_URL, $url); curl_setopt($curl, CURLOPT_FOLLOWLOCATION, 1); curl_setopt($curl, CURLOPT_TIMEOUT, 10); curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1); $data = curl_exec($curl); curl_close($curl); return $data;}$sum = 0;$pattern ='/v:average\">(.*)<\/span/';for ($i=0; $i <7 ; $i++) { $start = $i*STEP; $filter = $i+1; $temp_url = $url.'?start='.$start."&filter=".$filter; $temp_data = curl_request($temp_url); preg_match_all($pattern, $temp_data, $arr); if ($i==6) { $temp_arr = array_slice($arr['1'], 0,16); $sum += array_sum($temp_arr); } else{ $sum += array_sum($arr['1']);}}echo $sum;
0 0
- 千里码之爬虫-1
- 学习Python之爬虫1
- 爬虫闯关之旅-1
- Python之道-爬虫1
- scrapy爬虫(1)之xpath
- 千里码【23】爬虫-1
- Python爬虫之分布式爬虫
- 爬虫调研之Hetrix(1): 使用方法
- 知乎爬虫之1:开篇序言
- Python爬虫之Scrapy框架入门1
- Python爬虫之1 安装scrapy
- Python-网络爬虫之BeautifulSoup(1)
- python爬虫(1) 之下载图片
- 测试之道--网络爬虫系列1
- 爬虫之窃取网络小说(1)-yellowcong
- 1、网络爬虫之规则之requests库入门
- 网络爬虫之Spider
- 爬虫之事
- wind.js助力异步编程
- Win7 下文件或者目录无法删除,或者使用360等强力删除都不成功的情况下,可以试试这个
- 求割点模板(tarjan算法思路)
- 值类型与引用类型(线程堆栈与托管堆)
- sorted()排序详解
- 千里码之爬虫-1
- Java内存区域详解
- C语言4(数组)
- android 画一条分割线
- app在android 6.0或以上平台版本运行过程中请求权限
- python 网络数据采集(1-5章)
- mysql和oracle中的to_date()/to_char()互换
- 唐老师写给同学们的一封信
- JSONArray 数组 在不转为对象的情况下取出 某个元素组成列表