querylist 入门query部署,获取网页的信息。

来源:互联网 发布:网络爬虫 维基百科 编辑:程序博客网 时间:2024/06/05 22:56



                       1, 以thinkphp3.2  为例子,在thinkphp/libriy/创建一个目录 QL/  装入.qeurylist.php   和, queruseylist.class.php

                       2,在controller层里创建一个php 的文件,use  QL/queryliset.

                   

<?phpnamespace Home\Controller;use Think\Controller;use QL\QueryList;class IndexController extends Controller {    public function index(){        //采集某页面所有的图片        $data = QueryList::Query('http://cms.querylist.cc/bizhi/453.html',['image' => ['img','src']])->data;        //打印结果        print_r($data);    }}
 

 主要用的是query 的方法,如何引用

 $data =   QueryList::Query($page,$array)->data;
   ->data 的这个方法是再querylist里面的方法, 就好像我们thinkphp 里面的insert(),方法一样。

$page 变量是网页的连接,也可以是回调的字段。回调的后面来讲了。

$array 是数组 ,里面装的是我们要采集的内容。比如:['image' => ['img','src']]  ;