PHP篇之爬取豆瓣电影Top250的电影名
来源:互联网 发布:java web编程实战宝典 编辑:程序博客网 时间:2024/05/01 04:20
如题,将爬取到的电影名写入文件中
相关函数: file_get_contents() file_put_contents()
实现原理:
豆瓣Top250的信息被分成了10等分,即每次从数据库中调用25条数据显示出来,所以我们使用file_get_contents()时,只需修改地址中的GET提交的参数,即可遍历全部数据,再通过正则获取我们需要的信息,写入到文件中
直接贴代码:
class F{ //抓取页面 public static function start() { for ($i=0; $i < 250; $i+=25) { //豆瓣电影Top250的页面 $url = "https://movie.douban.com/top250?start=$i&filter="; $contents = file_get_contents($url); //调用封装在函数里的正则匹配 $msg = F::_B($contents); foreach ($msg as $key => $value) { //遍历写入文件 file_put_contents("movie.txt",$value.PHP_EOL,FILE_APPEND); } } } //字符串筛选 public static function _B($str){ $pattern = '/<a.*?<span class="title">([^<]+)/s'; preg_match_all($pattern,$str,$arr); //返回匹配到的数组 return $arr[1]; }}//调用F::start();
1 0
- PHP篇之爬取豆瓣电影Top250的电影名
- php爬虫爬取豆瓣电影top250内容
- Python爬取豆瓣电影top250
- Python爬取豆瓣电影Top250数据
- python+beautifulsoup爬取豆瓣电影TOP250
- nodejs爬取豆瓣top250电影信息
- scrapy爬取豆瓣TOP250电影
- Python爬取豆瓣电影top250
- scrapy ------ 爬取豆瓣电影TOP250
- python爬取豆瓣电影Top250
- 使用requests爬取豆瓣电影top250
- scrapy爬取豆瓣top250电影
- python爬取豆瓣电影top250
- scrapy1.3爬取豆瓣电影top250
- python爬豆瓣电影Top250
- 用Python爬虫爬取豆瓣TOP250电影
- Python 采用Scrapy爬虫框架爬取豆瓣电影top250
- python中lxml+cssselect爬取豆瓣电影Top250
- 基于Token的WEB后台认证机制
- linux下GraphicsMagick 的安装
- 通过appearance设置app主题
- Minimum Depth of Binary Tree
- 搭建自己的私有云
- PHP篇之爬取豆瓣电影Top250的电影名
- jsp 中ajax请求路径怎么写
- redis 存储数据结构及持久化方式--rdb 、aof
- 网易视频云朱玲:互动直播场景下的视频核心技术实践
- Leetcode 53. Maximum Subarray
- 【计算机视觉】Selective Search for Object Recognition论文阅读2
- 发送有序广播
- Mac 性能优化Instruments之Time Profiler
- Gradle for Android-管理多模块buld