php文件下载原理

来源:互联网 发布:双程2网络剧百度云盘 编辑:程序博客网 时间:2024/05/19 12:24
PHP文件下载原理

1、php下载原理图

2、文件下载源码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
<?php
$file_name="哈哈.jpg";//需要下载的文件
$file_name=iconv("utf-8","gb2312","$file_name");
$fp=fopen($file_name,"r+");//下载文件必须先要将文件打开,写入内存
if(!file_exists($file_name)){//判断文件是否存在
    echo"文件不存在";
    exit();
}
$file_size=filesize("a.jpg");//判断文件大小
//返回的文件
Header("Content-type: application/octet-stream");
//按照字节格式返回
Header("Accept-Ranges: bytes");
//返回文件大小
Header("Accept-Length: ".$file_size);
//弹出客户端对话框,对应的文件名
Header("Content-Disposition: attachment; filename=".$file_name);
//防止服务器瞬时压力增大,分段读取
$buffer=1024;
while(!feof($fp)){
    $file_data=fread($fp,$buffer);
    echo$file_data;
}
//关闭文件
fclose($fp);
?>

3、文件编码问题解决方法:

  如果文件名是中文,php的函数不能识别中文文件名,一般如果程序编码为utf-8,php的函数比较古老,只能识别gb2312编码的中文,所以把中文用iconv(“原编码”,”要转成的编码”,”要转码的字符串”)函数可以转码。

  比如,把一个字符串从utf-8转码为gb2312

  $file_name=iconv(“utf-8”,”gb2312”,”$file_name”);

 
 
 

7.1.2  PHP文件下载的原理及实现

通常文件下载过程是十分简单的,建立一个链接指向到目标文件就可以了。例如下面的链接:

  1. <a href=http://www.xxx.com/xxx.rar>点击下载文件</a> 

但是,实际情况可能会稍复杂。比如需要用户填写完整注册信息后才可以下载该文件,这时最先想到的是使用Redirect的方式。下面介绍两种方式。

(1)用Redirect方式。先检查表格是否已经填写完毕和完整,然后将链接指到该文件,这样用户就可以下载。请看下面的示例代码:

  1. <?php 
  2. /*文件功能:检查变量form是否完整*/  
  3. if($form){  
  4. //重新定向浏览器指向  
  5. Header("Location: http:// http://www.xxx.com/xxx.rar");  
  6. exit;  
  7. }  
  8. ?> 

(2)根据下载文件的序号来查找,链接的形式如下:
  1. <a href="http://www.xxx.com/download.php?id=123456">点击下载文件</a> 

上面的链接使用ID方式接收要下载文件的编号,然后再用Redirect的方式连接到真实的文件链接。

以上这两种方法虽然实现了文件的下载功能,但是缺点是直接暴露了文件所属的路径,而且没有防盗链的功能,所以上面的方式是简单直接但存在安全隐患的文件下载方式。在PHP中,通常是利用header()函数和fread()函数来实现安全的文件下载。

例如,需要下载的是一个文件名为xxx.rar的文件,首先创建文件是download.php的PHP文件。通过前面的例子很容易通过文件的ID号从数据库中得到待下载文件的真实位置,在获得文件的真实存储位置后,可以通过header()函数的location参数直接重定向到这个文件。但是这样仍然是不安全的,因为某些下载软件还是可以通过重定向分析获得该文件的位置信息。因此需要用另外一种方法,就是PHP的文件处理API函数。它是通过fread()函数把文件直接输出到浏览器提示用户下载,这样所有的处理都是在服务器端完成的,因此用户就无法获得文件具体存储位置信息的,示例代码如下:

  1. <? 
  2. $file_name = "xxx.rar";     //下载文件名  
  3. $file_dir = "./up/";        //下载文件存放目录  
  4. //检查文件是否存在  
  5. if (! file_exists ( $file_dir . $file_name )) {  
  6.     echo "文件找不到";  
  7.     exit ();  
  8. } else {  
  9.     //打开文件  
  10.     $file = fopen ( $file_dir . $file_name, "r" );  
  11.     //输入文件标签   
  12.     Header ( "Content-type: application/octet-stream" );  
  13.     Header ( "Accept-Ranges: bytes" );  
  14.     Header ( "Accept-Length: " . filesize ( $file_dir . $file_name ) );  
  15.     Header ( "Content-Disposition: attachment; filename=" . $file_name );  
  16.     //输出文件内容   
  17.     //读取文件内容并直接输出到浏览器  
  18.     echo fread ( $file, filesize ( $file_dir . $file_name ) );  
  19.     fclose ( $file );  
  20.     exit ();  
  21. }  
  22. ?> 

【代码解读】

上述代码中,程序发送Header信息是用来告诉Apache和浏览器下载文件的相关信息的。content-type的含义代表文件MIME类型是文件流格式。如果在Apache配置里面把文件的MIME类型设为application/octet-stream(如add application/octet-stream .xxx.rar),那么浏览器(客户端)就会知道,这是一个文件流格式的文件并提示用户下载。Accept-Ranges是一个响应头标,它允许服务器指明将在给定的偏移和长度处,为资源组成部分的接受请求,该头标的值被理解为请求范围的度量单位。Content-Length是指定包含于请求或响应中数据的字节长度,例如,Content-Length:382。Content-Disposition:attachment是用来告诉浏览器,文件是可以当做附件被下载,下载后的文件名称为$file_name该变量的值。

运行download.php文件,效果如图7.2所示。从图中可以看到文件按照预想的方式被提示下载,单击"保存"按钮将文件保存在本地。

 图7.2  PHP文件安全下载
 
 
 
对于HTTP协议,向服务器请求某个文件时,只要发送类似如下的请求即可:
GET /Path/FileName HTTP/1.0 
Host: www.caiban.net:80 
 Accept: */*
User-Agent: GeneralDownloadApplication
Connection: close
每行用一个“回车换行”分隔,末尾再追加一个“回车换行”作为整个请求的结束。第一行中的GETHTTP协议支持的方法之一,方法名是大小写敏感的,HTTP协议还支持OPTIONSHAEDPOSTPUTDELETETRACECONNECT等方法,而GETHEAD这两个方法通常被认为是“安全的”,也就是说任何实现了HTTP协议的服务器程序都会实现这两个方法。对于文件下载功能,GET足矣。GET后面是一个空格,其后紧跟的是要下载的文件从WEB服务器根开始的绝对路径。该路径后又有一个空格,然后是协议名称及协议版本。除第一行以外,其余行都是HTTP头的字段部分。Host字段表示主机名和端口号,如果端口号是默认的80则可以不写。Accept字段中的*/*表示接收任何类型的数据。User-Agent表示用户代理,这个字段可有可无,但强烈建议加上,因为它是服务器统计、追踪以及识别客户端的依据。Connection字段中的close表示使用非持久连接。关于HTTP协议更多的细节可以参考RFC2616HTTP 1.1)。因为我只是想通过HTTP协议实现文件下载,所以也只看了一部分,并没有看全。如果服务器成功收到该请求,并且没有出现任何错误,则会返回类似下面的数据:
HTTP/1.0 200 OK
Content-Length: 13057672 Content-Type: application/octet-stream
Last-Modified: Wed, 10 Oct 2005 00:56:34 GMT 
Accept-Ranges: bytes 
ETag: "2f38a6cac7cec51:160c"
Server: Microsoft-IIS/6.0 
X-Powered-By: ASP.NET 
Date: Wed, 16 Nov 2005 01:57:54 GMT 
Connection: close 
不用逐一解释,很多东西一看几乎就明白了,只说我们大家都关心内容吧。 
第一行是协议名称及版本号,空格后面会有一个三位数的数字,是HTTP协议的响应状态码,200表示成功,OK是对状态码的简短文字描述。状态码共有5类:1xx属于通知类;2xx属于成功类;3xx属于重定向类;4xx属于客户端错误类;5xx属于服务端错误类。对于状态码,相信大家对404应该很熟悉,如果向一个服务器请求一个不存在的文件,就会得到该错误,通常浏览器也会显示类似“HTTP 404 - 未找到文件”这样的错误。Content-Length字段是一个比较重要的字段,它标明了服务器返回数据的长度,这个长度是不包含HTTP头长度的。换句话说,我们的请求中并没有Range字段(后面会说到),表示我们请求的是整个文件,所以Content-Length就是整个文件的大小。其余各字段是一些关于文件和服务器的属性信息。 
这段返回数据同样是以最后一行的结束标志(回车换行)和一个额外的回车换行作为结束,即“/r/n/r/n”。而“/r/n/r/n”后面紧接的就是文件的内容了,这样我们就可以找到“/r/n/r/n”,并从它后面的第一个字节开始,源源不断的读取,再写到文件中了。 
上就是通过HTTP协议实现文件下载的全过程。但还不能实现断点续传,而实际上断点续传的实现非常简单,只要在请求中加一个Range字段就可以了。假如一个文件有1000个字节,那么其范围就是0-999,则:Range: bytes=500-     表示读取该文件的500-999字节,共500字节。Range: bytes=500-599  表示读取该文件的500-599字节,共100字节。Range还有其它几种写法,但上面这两种是最常用的,对于断点续传也足矣了。如果HTTP请求中包含Range字段,那么服务器会返回206Partial Content),同时HTTP头中也会有一个相应的Content-Range字段,类似下面的格式:
Content-Range: bytes 500-999/1000
Content-Range字段说明服务器返回了文件的某个范围及文件的总长度。这时Content-Length字段就不是整个文件的大小了,而是对应文件这个范围的字节数,这一点一定要注意。
一切好像基本上没有什么问题了,本来我也是这么认为的,但事实并非如此。如果我们请求的文件的URL是类似http://www.server.com/filename.exe这样的文件,则不会有问题。但是很多软件下载网站的文件下载链接都是通过程序重定向的,比如pchomeACDSeeHTTP下载地址是:
http://download.pchome.net/php/tdownload2.php?sid=5547&url=/multimedia/viewer/acdc31sr1b051007.exe&svr=1&typ=0
这种地址并没有直接标识文件的位置,而是通过程序进行了重定向。如果向服务器请求这样的URL,服务器就会返回302Moved Temporarily),意思就是需要重定向,同时在HTTP头中会包含一个Location字段,Location字段的值就是重定向后的目的URL。这时就需要断开当前的连接,而向这个重定向后的服务器发请求。
 
 

7.1.1  PHP文件上传的原理及实现

在PHP中,文件上传功能是使用PHP提供的文件函数来实现的。下面通过例子使读者直观地了解上传的原理以及程序编码的实现。

1.客户端上传

创建一个文件upload.html,这是一个最基本的上传的表单代码,代码如下:

  1. <html xmlns="undefined"> 
  2. <head> 
  3. <title>文件上传页面</title> 
  4. <meta http-equiv="Content-Type" content="text/html; charset=gb2312"> 
  5. <meta name="description" content="文件上传页面" /> 
  6. <style type="text/css"> 
  7. body,td{font-family:tahoma,verdana,arial;font-size:11px;line-height:  
  8. 15px;background-color:white;color:#666666;  
  9. strong{font-size:12px;}  
  10. a:link{color:#0066CC;}  
  11. a:hover{color:#FF6600;}  
  12. a:visited{color:#003366;}  
  13. a:active{color:#9DCC00;}  
  14. a{TEXT-DECORATION:none}  
  15. td.irows{height:20px;background:url("index.php?i=dots") repeat-x bottom}  
  16. </style> 
  17. </head> 
  18. <body bgcolor="#FFFFFF"> 
  19. <center> 
  20.   <form enctype="multipart/form-data" method="post" name="upform"   
  21.   action=""> 
  22.     <table border="1" width="55%" id="table1" cellspacing=0> 
  23.       <tr> 
  24.         <td colspan="2"> 
  25.             <p align="center">上传文件:  
  26.         </td> 
  27.       </tr> 
  28.       <tr> 
  29.         <td width="10%"></td> 
  30.         <td width="71%"> 
  31.             <input type="hidden" name="max_file_size" value="100000">   
  32.             <input name="userfile" type="file"> 
  33.             <input type="submit" value="上传文件"> 
  34.         </td> 
  35.       </tr> 
  36.     </table> 
  37.  </form> 
  38. </center> 
  39. </body> 
  40. </html> 

在浏览器中加载upload.html文件,效果如图7.1所示。

 图7.1  文件上传表单预览要实现文件的上传,需要在表单标签中设置以下选项,以确保匿名上传文件的正确编码。
  1. enctype="multipart/form-data" 

【代码解读】

表单选项MAX_FILE_SIZE的隐藏值域,通过设置Value值的大小可以限制上传文件的尺寸。当然,MAX_FILE_SIZE的值相对于浏览器只是一个参考值,实际上它可以被轻易地绕过。实际应用中是通过在PHP配置文件中设置上传文件最大值,来做上传文件的限制的。在表单中加上MAX_FILE_SIZE,可以及时发现上传文件尺寸过大的问题。

2.服务器端上传

创建服务器端上传处理文件upload.php,代码如下:

  1. <?php 
  2.     $file = &$HTTP_POST_FILES ['userfile']; //接收表单信息  
  3.     $dest_dir = 'up';                           //设定上传目录  
  4.     $dest = $dest_dir . time () . $file ['name'];    //设置文件名为时间加文件名,这样可有效避免重复  
  5.     if (! $file) {  
  6.         echo "<font color='red'>移动文件出错!</a>";  
  7.         exit ();  
  8.     } else {  
  9.         $r = move_uploaded_file ( $file ['tmp_name'], $dest );  
  10.         //chmod($dest, 0755);   //设定上传的文件的属性   
  11.         echo "<font color='red'>恭喜文件" . $dest . "上传成功!</a>";  
  12.     }  
  13. ?> 

【代码解读】

当文件上传成功后,系统会提示文件上传成功的信息。上面例子中$_FILES['userfile']数组的内容含义如下所示。

$_FILES['userfile']['name']:客户端机器文件的原名称。

$_FILES['userfile']['type']:文件的MIME类型,例如"image/gif"。

$_FILES['userfile']['size']:已上传文件的大小,单位为B。

$_FILES['userfile']['tmp_name']:文件被上传后在服务端储存的临时文件名。

$_FILES['userfile']['error']:该文件上传相关的错误代码。

其中,错误代码的含义如下所示。

值0:没有错误发生,文件上传成功。

值1:上传的文件超过了php.ini中upload_max_filesize选项限制的值。

值2:上传文件的大小超过了HTML表单中MAX_FILE_SIZE选项指定的值。

值3:文件只有部分被上传。

值4:没有文件被上传。