php 截取其它网站信息
来源:互联网 发布:骑行软件 编辑:程序博客网 时间:2024/05/16 07:16
页面当中要插入与之相关的最新动态,几毛钱的小项目不可能真的使用爬虫去爬,百度、谷歌有现成的,移花接木应该可以实现。
但是不幸的是百度对直接使用php语句访问页面做了限制,而谷歌访问不了,总不至于让服务器去翻墙,但是傻帽搜狗可以实现,代码如下:
直接将网页以文件的形式导入进行操作:
file_get_content
<?php// 从百度搜索当中无法获取 因为百度搜索限制使用代码直接访问$url = "http://www.sogou.com/web?query=清华大学&ie=utf8";$contents = file_get_contents ( $url );// 汉语输出echo "<meta http-equiv='Content-Type' content='text/html; charset=utf-8'>";var_dump ( $contents );// 起始字符位置$start_ch = strpos ( $contents, '<ul class="str-ul-list new-ul-list">' );// 结束字符为止$end_ch = strpos ( $contents, '</ul>', $start_ch ) + 5;if ($start_ch == false) {$new_str = "没有新闻";} else {$new_str = substr ( $contents, $start_ch, $end_ch - $start_ch + 1 );}echo "起始字符位置:" . $start_ch . "终止字符位置:" . $end_ch;echo $new_str . "<br/>";
使用curl操作:
<?php$curl = curl_init ();// 设置你需要抓取的URLcurl_setopt ( $curl, CURLOPT_URL, 'http://www.sogou.com/web?query=南京大学&ie=utf8' );curl_setopt ( $curl, CURLOPT_HEADER, 1 );curl_setopt ( $curl, CURLOPT_RETURNTRANSFER, 1 );// 运行cURL,请求网页$data = curl_exec ( $curl );// 关闭URL请求curl_close ( $curl );// 汉语输出echo "<meta http-equiv='Content-Type' content='text/html; charset=utf-8'>";// 起始字符位置$start_ch = strpos ( $data, '<div class="strBox">' );// 结束字符为止$end_ch = strpos ( $data, '</div>', $start_ch ) + 6;if ($start_ch == false) {$new_str = "没有新闻";} else {$new_str = substr ( $data, $start_ch, $end_ch - $start_ch + 1 );}echo $new_str . "<br/>";
Call to undefined function curl_init()
取消php.ini中extension=php_curl.dll的注释
抓取页面图片
<?phpfunction grab_pic($img_url, $save_url) {//判断远程服务器上文件是否存在不能够使用file_exist();if (@fopen ( $img_url, 'r' )) {echo 'File Exits';//将图片从url以字符串的形式读入$img_data = file_get_contents ( $img_url );//写入 .jpg文件$pic_state = file_put_contents ( $save_url, $img_data );} else {echo 'File Do Not Exits';}}$college_id="10026";$img_url = "http://sinastorage.com/kaoshi.edu.sina.com.cn/college_photo/".$college_id.".jpg";$save_url= $college_id.".jpg";//抓取$img_str = grab_pic ( $img_url, $save_url);// echo $ima_str;echo "<img src='$college_id.jpg'/>";
0 0
- php 截取其它网站信息
- PHP----字符串(支持中文和其它编码)截取,后加自定义标识符
- PHP截取字符串函数,其它用省略号表示(...)不会出现中文乱码
- 用flash as3截取摄像头图片信息交由php保存[flash+php保存图片]
- 字符串截取,支持中文和其它编码
- 根据Url地址得到网页的html源码,截取网站信息的核心程序
- ASP.net从其他网站抓取内容并截取有用信息
- [ 转]C#(ASP.net)从其他网站抓取内容并截取有用信息
- 信息的截取
- 截取通知栏信息
- Grails扒其它网站数据
- 学习其它网站的布局
- php curl函数模拟浏览器抓取网站信息
- 用php获取网站中的信息,CURL组件测试
- 使用PHP curl模拟浏览器抓取网站信息
- PHP+MYSQL网站信息的增删改查代码
- PHP中汉字截取
- PHP中汉字截取
- 如何解决SQL Server内存不断增加问题
- Git中文教程
- spdofsound 340.29定义
- POJ3207——Ikki's Story IV - Panda's Trick
- Javascript面向对象编程(三):非构造函数的继承
- php 截取其它网站信息
- 多Web服务器之间共享Session的解决方案
- JSF入门十(自定义转换器)
- 解决ViewPager 高度wrap_content无效问题
- acm steps 1.3.2(百步穿杨)
- 你能帮我吗在此
- RequireJS Optimizer 的使用和配置方法
- OCP 1Z0 053 267
- 黑马程序员 :项目银行操作系统的学习和理解