代码采集 snoopy
来源:互联网 发布:淘宝质量问题赔钱 编辑:程序博客网 时间:2024/06/07 03:03
//////////////////////php代码部分
public function snoopy()
{require_once APP_PATH . 'Home/Model/Snoopy.class.php';
//include 'Home/Model/Snoopy.class.php'; //加载Snoopy类
$snoopy = new \Snoopy(); //实例化一个对象
$sourceURL = "http://www.ithome.com/"; //要抓取的网页
$snoopy->fetch($sourceURL);//获取所有内容
$conn = $snoopy->results;
//print_r(utf8_encode($a));
$content=$this->my_encoding($conn, 'utf-8');
$pregContent = "/<div class=\"lst lst-1 new-list\">(.*?)<div class=\"page_nav\">/iU";
preg_match_all($pregContent, $content, $contentArray);//匹配内容到arr数组
$connEnd = $contentArray[1][0];
// $kaishi="lst lst-1 new-list";
// $jieshu="page_nav";
// $kaishizishu = stripos($content,$kaishi);
// $jieshuzishu = stripos($content,$jieshu);
// $connEnd = substr($content,$kaishizishu+ strlen($kaishi), $jieshuzishu - ($kaishizishu + strlen($kaishi)));
$connEnd = str_replace("<div class=\"block new-list-1\"><ul><li class=\"top\">","",$connEnd);
$connEnd = str_replace("</ul><ul>","",$connEnd);
$liArry = explode("</li>",$connEnd);
$pattern = "/<a target=\"_blank\" href=\"(.*?)\".*?>(.*?)<\/a>/i";
$data_array = array();
foreach($liArry as $item){
$_itemArr = array();
preg_match_all($pattern, $item, $_itemArr);//匹配内容到arr数组
array_push($data_array,$_itemArr);
}
// print_r($data_array);
// exit();
$this->assign("dateList",$data_array);
$this->assign("itemPageUrl",U('Index/itemPage'));
$this->display();
}
///////////////////////////html代码部分
<div class="page-group">
<div class="page" id="page-index">
<!-- 标题栏 -->
<header class="bar bar-nav">
<h1 class="title">IT之家</h1>
</header>
<!-- 这里是页面内容区 -->
<div class="content">
<div class="list-block">
<ul>
<foreach name="dateList" item="vo">
<li class="item-content">
<div class="item-inner">
<div class="item-title">
<a href="#" data-href="{$vo[1][0]}">{$vo[2][0]}</a>
</div>
</div>
</li>
</foreach>
</ul>
</div>
</div>
</div>
</div>
- 代码采集 snoopy
- snoopy 采集
- PHP采集利器:Snoopy
- snoopy采集类
- PHP采集利器:Snoopy
- Snoopy采集类
- php+snoopy 数据采集
- 二.Snoopy采集(斗牛)
- snoopy采集和模拟提交
- PHP采集类snoopy详细介绍(snoopy使用教程)
- PHP采集利器:Snoopy 试用心得
- PHP采集利器:Snoopy 试用心得
- PHP采集利器:Snoopy 试用心得【转】
- PHP采集利器snoopy应用详解【转】
- PHP采集利器snoopy应用详解
- PHP采集利器:Snoopy 试用心得
- PHP采集利器:Snoopy 试用心得
- PHP采集利器:Snoopy 试用心得
- ceilometer + gnocchi + aodh集成(004) ---- 告警使用
- shell学习随笔
- 加载动态库中的导出类时出现link2001的错误
- 递归函数
- 软件开发方法基础
- 代码采集 snoopy
- 【Vue】 -(7) 事件和方法
- 设计师们!如何知道自己正在犯错并且修复问题,重建信任?
- JDBC连接数据库
- Bitmap使用
- android 引用第三方jar java.lang.NoClassDefFoundError解决方法
- .9.png总结
- 监控
- 文章标题