php 实现信息采集(网页内容抓取)程序代码
来源:互联网 发布:万德数据 编辑:程序博客网 时间:2024/05/22 02:21
php 实现信息采集(网页内容抓取)程序代码
<?//采集首页地址$url="http://www.xz-src.com/";//获取页面代码$rs=file_get_contents($url);//设置匹配正则//$fp=fopen("text.txt","a");//$fw=fwrite($fp,$rs);//fclose($fp);/*<I class=titles><Ahref="http://www.xz-src.com/"target=_blank>留住你身边的好男人</A></I>*/$preg='/<i\s+class=\"titles\"><a\s+href=\"[^>]+\">(.*)<\/a><\/i>/i';//进行正则搜索preg_match_all($preg,$rs,$title);//计算标题数量$count=count($title[0]);echo $count."<br>";//通过标题数量进行内容采集for ($i=0;$i<$count;$i++){ //设置内容页地址$pr='/<a\s+href=\"[^>]+\">/isU';preg_match_all($pr,$title[0][$i],$jurl);$substr=substr($jurl[0][0],9);$curl=substr($substr,0,-18);//获取内容页代码$c=file_get_contents($curl);//设置内容页匹配正则$pc='/<a\s+href=\"[^>]+\">/i';//进行正则匹配搜索preg_match($pc,$c,$content);//输出标题echo $title[0][$i]."<br>";echo $title[1][$i]."<br>";$concount=count($content[0]);echo $concount."<br>";echo $content[0][0];for ($j=0;$j<$concount;$j++){ }}?>
阅读全文
0 0
- php 实现信息采集(网页内容抓取)程序代码
- 几种PHP实现网页抓取的程序代码
- 几种PHP实现网页抓取的程序代码
- PHP抓取网页内容
- php抓取网页内容
- php抓取网页内容
- php 抓取网页信息
- 抓取网页信息PHP
- php抓取alexa网页内容 提取站点统计信息
- 网页信息采集实现
- 用PHP抓取网页内容
- PHP抓取网页内容汇总
- php抓取网页内容汇总
- php抓取网页内容汇总
- PHP抓取网页内容汇总
- PHP抓取网页内容经验总结
- php抓取网页内容汇总
- PHP抓取网页内容获得网页源代码
- hdu2643
- Linux学习------目录架构
- bzoj1850: Submatrix
- leetcode解题报告22. Generate Parentheses
- POJ 3422 Kaka's Martix Travels 费用流模板
- php 实现信息采集(网页内容抓取)程序代码
- 关于Unity在2D的UGUI和3D模型交错时渲染顺序的一点探讨
- 资源
- 【POJ3009】Curling 2.0(深搜)
- 最小生成树Prim算法理解
- JZOJ 3766. 【BJOI2014】大融合
- 当国家选择是香港时运输方式:EUB、EUB2、SHEUB 中的邮编栏置灰
- bitset位集合容器
- aizu/aoj-0118-Property Distribution