php采集页面内容并自动转码
来源:互联网 发布:公司制律师事务所知乎 编辑:程序博客网 时间:2024/06/05 04:34
php采集页面内容并自动转码
- /*
- * 用法 get_contents('www.yi210.com', 'utf-8');
- * 采集页面内容并自动转码
- * get_contents()自定义函数
- * $url 需要采集的页面地址
- * $timeout 超时时间,默认20
- */
- function get_contents($url, $timeout = 20)
- {
- if( function_exists('curl_init') ){
- $ch = curl_init();
- curl_setopt( $ch, CURLOPT_URL, $url );
- curl_setopt( $ch, CURLOPT_HEADER, false );
- curl_setopt( $ch, CURLOPT_TIMEOUT, $timeout );
- curl_setopt( $ch, CURLOPT_RETURNTRANSFER, 1 );
- curl_setopt( $ch, CURLOPT_CONNECTTIMEOUT, $timeout );
- $content = curl_exec( $ch );
- curl_close( $ch );
- $data = $content ? $content : false;
- } else {
- //利用了stream_context_create()设置超时时间:
- $pots = array(
- 'http' => array(
- 'timeout' => $timeout
- )
- );
- $context = stream_context_create( $pots );
- $content = @file_get_contents( $url, false, $context );
- $data = $content ? $content : false;
- }
- return $data ? my_encoding( $content, 'utf-8' ) : false;
- }
- /*
- * 页面内容并自动转码
- * my_encoding()自定义函数
- * $data 为 curl_exec() 或 file_get_contents() 所获得的页面内容
- * $to 需要转成的编码
- */
- function my_encoding( $data, $to )
- {
- $encode_arr = array('UTF-8','ASCII','GBK','GB2312','BIG5','JIS','eucjp-win','sjis-win','EUC-JP');
- $encoded = mb_detect_encoding($data, $encode_arr);
- $data = mb_convert_encoding($data,$to,$encoded);
- return $data;
- }
复制代码
0 0
- php采集页面内容并自动转码
- php采集页面内容并自动转码
- php采集页面并自动转码
- 求助,怎么实现新闻自动采集并更新内容
- 解决php无法通过file_get_contents或curl采集页面内容
- 解决php无法通过file_get_contents或curl采集页面内容
- PHP自动判断字符集并转码
- 火车头采集器 题解页面信息采集 过滤采集内容
- php生成图表,并和页面内容能够一起显示
- php把采集内容中图片地址下载并替换成本地地址
- web编程之内容自动采集器模块(PHP+Mysql)
- PHP采集图片并保存
- PHP采集图片并保存
- PHP内容采集器(PHP小偷程序)
- ASP采集页面内容组件Microsoft.XMLHTTP
- 通过C#采集指定地址页面内容
- C#对Ajax页面内容采集
- PHP采集利器:phpQuery,像jQuery一样轻松采集内容
- jstorm-yarn 启动流程总结
- poj2411Mondriaan's Dream
- 04-1. 水仙花数(20)
- C#网络编程(一)------最简单的基于cs的sokect通讯程序
- JAVA设计模式
- php采集页面内容并自动转码
- 04-2. 打印九九口诀表(15)
- android项目 之 记事本(2)------- 添加照片
- Can't find (or read) directory to add to classloader: ../../../contrib/extraction/lib (resolved as:
- 04-3. 统计素数并求和(20)
- 各种排序算法
- 04-4. 猜数字游戏(15)
- POJ-3169 Layout
- UVA12716 GCD XOR 数论数学构造