网站css内图片下载脚本

来源:互联网 发布:一元云购指定中奖源码 编辑:程序博客网 时间:2024/04/30 10:19
觉得功能太烂BUG太多的,想加以改进的朋友,可以下载下面的压缩包进行修改补充,这次我加了足够的注释,方便大家阅读
解压之后把整个文件夹(saveimg1.4)放在www目录下通过浏览器访问http://localhost/saveimg1.4/ 即可使用 saveimg1.4.rar (5 K) 下载百度首页外链式css(http://su.bdimg.com/static/superpage/css/index_min_0ffaafc0.css)为例



--------------------------已修正--------------------------

2012.11.29

    代码简化之判断css文件所在的文件夹目录
        ############################
        之前的代码为:
        ############################
        //$url="http://192.168.190.47/phpwind/images/pw_core.css?20111111";
        function getbaseurl($url){
            $a=ltrim($url,'http://');
            $b=explode('/',$a);
            array_pop($b);
            $c=implode('/',$b);
            $baseurl='http://'.$c.'/';
            return $baseurl;
        }
        ############################
    去掉之前用的切割组合,使用系统默认函数dirname()
    echo dirname("http://192.168.190.47/phpwind/images/down.png");
    //输出结果为:“http://192.168.190.47/phpwind/images”

2012.11.30

    1.bug修复 => 修复即使文件下载为空都提示下载成功的错误。
    2.简化下载代码,也许底层执行过程是一样的,只是php代码减少了一点。

    --------------------------原代码--------------------------
    ob_start();
    readfile($url);
    $obj=ob_get_contents();
    ob_end_clean();
    $fp2=fopen($filename,"w");
    fwrite($fp2,$obj);
    fclose($fp2);
    echo $url.'<font color="green">下载成功</font><br/>';
    --------------------------修改为--------------------------
    $b=file_get_contents($url);
    $c=file_put_contents($filename,$b);
    if($c!=0){
        echo $url.'<font color="green">下载成功</font><br/>';
    }else{
        echo $url.'<font color="red">下载失败</font><br/>';
    }

2012.12.03

    css中的图片地址BUG修复
        今天在采集新浪的某个页面的时候发现其中的css图片的地址采用的是url(/images/xx.jpg)这样的格式
        而不是url(./images/xx.jpg)
        也不是url(images/xx.jpg)
        这样这个图片的地址就是www_sian.cn/images_xx_jpg
        而非www_sian.cn/css/images/xx_jp_g(假设css文件放在了www.sian.cn/css目录下)
        这样在获去了css中的图片地址之后则需要做一个正则匹配

        下面需要考虑图片地址在url的引用方法
        1    images/xxx.jpg
        2  ./images/xxx.jpg
        3 ../images/xxx.jpg
        4   /images/xxx.jpg

        $check=preg_match('/^\//',$z);//这里$z代表url()中的图片地址的字符串
        if($check==1){
            echo 'YES';//是第四种情况
        }else{
            echo 'NO';//不是第四种情况
        }

2012.12.08

    获取css中图片地址的方法修改
        可能最开始想的是直接取出css中的url()整个元素,所以一直向正则匹配那边在想,使用的是$arr=preg_split('/url\(/',$content);
        既然没有利用到正则的优势,似乎使用$arr=explode('url(',$content)效率要高一些?

2012.12.08

    1.css文件中url图片地址地址修复
        坑爹的百度贴吧居然使用了background:url(http://tb2.bdstatic.com/tb/style/chat/img/new.gif)这样的方法
        只能再多加一个判断了
        1    images/xxx.jpg
        2  ./images/xxx.jpg
        3 ../images/xxx.jpg
        4   /images/xxx.jpg
        5    http://
        $check=preg_match('/^http/',$z);
        if($check==1){
            //直接保存图片地址
        }else{
            $check2=preg_match('/^\//',$z);//这里$z代表url()中的图片地址的字符串
            if($check2==1){
                echo 'YES';//是第四种情况
            }else{
                echo 'NO';//不是第四种情况
            }
        }

--------------------------未解决--------------------------

新浪博客、新浪微博的css文件保存之后是乱码,我能想到的就是使用file_get_contents( )和file_put_contents( )来实现文件下载出现了问题。

原文地址:http://bbs.lampbrother.net/read-htm-tid-150076.html
阅读(22) | 评论(0) | 转发(0) |
0

上一篇:关于facebook的hiphop

下一篇:战地日记 第二篇 一月总结及一些感想

相关热门文章
  • 怎样在网上卖东西?
  • 【原创】ganglia被监控机部署...
  • 美国RT服务器租用仿牌网站不二...
  • 阿波说:删除负面-负面删除...
  • 【本港财经】建行(亚洲)发明虚...
  • 毕业五年(续)
  • 毕业五年
  • 职业生涯规划
  • 中国软件开发工程师之痛...
  • 闲置书处理!
  • 大家都是用什么来管理hadoop集...
  • 网站被人挂了吗,添加了些程序...
  • Nginx如何保证不走宕机的那个...
  • 大家谈谈MYSQL客户端和服务器...
  • 以下代码运行后为何会输出5?...
给主人留下些什么吧!~~
原创粉丝点击