PHP 实现URL爬虫功能
来源:互联网 发布:剑网3更新网络中断 编辑:程序博客网 时间:2024/05/17 13:13
项目中碰到,需要使用PHP 实现URL爬虫功能。研究了一下。
代码如下:
<?php
$html = getURL('http://9iphp.com/web/php/1112.html');function getURL($URL){
$html = file_get_contents($URL);
$dom = new DOMDocument();
@$dom->loadHTML($html);
$xpath = new DOMXPath($dom);
$hrefs = $xpath->evaluate('/html/body//a');
for ($i = 0; $i < $hrefs->length; $i++) {
$href = $hrefs->item($i);
$url = $href->getAttribute('href');
// 保留以http开头的链接
if(substr($url, 0, 4) == 'http')
echo $url.'<br />';
}
}
?>
0 0
- PHP 实现URL爬虫功能
- PHP实现URL重定向功能
- PHP实现一个简单url路由功能
- php 实现简单爬虫
- 使用php 的缓冲区功能和apache的url重写功能实现静态html生成实例
- 使用php 的缓冲区功能和apache的url重写功能实现静态html生成实例
- python实现简单爬虫功能
- python实现简单爬虫功能
- python实现简单爬虫功能
- python实现简单爬虫功能
- python实现简单爬虫功能
- python实现简单爬虫功能
- python实现简单爬虫功能
- python实现简单爬虫功能
- python实现简单爬虫功能
- python实现简单爬虫功能
- python实现简单爬虫功能
- python实现简单爬虫功能
- 【大运维之二】DevOps年中盘点:国外最受欢迎的10篇技术文章(上)
- Ant 判断某个文件是否为空
- Android EditText限制小数点输入两位
- graylogserver打包tgz
- hibernate session缓存和java对象生命周期
- PHP 实现URL爬虫功能
- web开发中组件线程安全问题
- 【大运维之三】IT架构的渊源及方法论
- Redis 数据持久化
- python快速使用(二)python面向过程编程
- intellij idea 简单使用教程
- 单链表逆序:通过递归和循环实现。
- acid(数据库事务正确执行的四个基本要素的缩写)
- 关于时间