php写爬虫进行采集 QueryList的使用

来源:互联网 发布:支持国密算法的浏览器 编辑:程序博客网 时间:2024/05/21 18:50

介绍:

QueryList 是基于phpquery 发开的一个采集类

phpquery是老外开发的,querylist对其进行了更加人性化的封装,更方便,从而充满生命力


安装:

这里只介绍通过composer安装,更多详细内容可参考http://www.php.cn/php/php-QueryList-down.html


1、如果还没安装过composer请参照官网先进行composer安装:

https://pkg.phpcomposer.com/#how-to-install-composer


2、QueryList安装:

composer安装好后,在项目根目录新建一个 composer.json 文件,声明要安装的包,内容如下:

{    "require": {        "jaeger/querylist": "^3.1",        "jaeger/querylist-ext-request":"^1.0",        "jaeger/querylist-ext-multi":"^1.0",        "jaeger/querylist-ext-login":"^1.0"    }}

在命令行运行 composer install 

(如果之前install过,执行composer update更新命令,避免重复安装;

如果composer不是全局安装的而是局部安装的 请在composer.phar文件所在目录执行 php composer.phar install  【或者update命令】)


安装完成后通过 

require 'vendor/autoload.php';

引入我们的QueryList ( autoload.php 是composer 提供的自动引入类,帮我们自动引用安装的依赖)


执行测试代码:

<?phprequire 'phpQuery.php';require 'QueryList.php';use QL\QueryList;$hj = QueryList::Query('http://mobile.csdn.net/',array("url"=>array('.unit h1 a','href')));$data = $hj->getData(function($x){    return $x['url'];});print_r($data);

如果能正常打印出采集的内容,说明已经可以使用了


更多详细内容请参考: http://www.php.cn/php/php-QueyList-kaishi.html



原创粉丝点击