|
前言
介绍一种比较高端检测上传文件类型的方法,可以防止后缀名修改等低端的检测错误,有耐心的同学可以参考一下,我会封装成类供调用
MIME类型
在把输出结果传送到浏览器上的时候,浏览器必须启动适当的应用程序来处理这个输出文档。这可以通过多种类型MIME(multipurpose internet mail extensions)来完成。在http中,MIME类型被定义在content-type header中。
例如,如果客户端上传一个excel文件到服务器上,那么这是的mime类型就是“application/vnd.ms-excel”。在php中,可以通过$_FILE["type"]获得上传文件类型。
最早的HTTP协议中,并没有附加的数据类型信息,所有传送的数据都被客户端解释为HTML文档,而为了支持多媒体数据类型,HTTP协议中就使用了附加在文档之前的MIME数据类型信息来标识数据类型。
每个MIME类型由两部分组成,前面是数据的大类别,后面定义具体的种类。(具体可以查询mime类型表)
文件检测弊端
- 文件扩展名检测漏洞(ps:文件扩展名可以被任意伪造)
- 文件MIME类型判断不能使用$_FILES['userfile']['type'](ps:根据PHP官方的文档说明,该值完全可以被伪造!黑客只需修改浏览器的post请求头即可绕过这段代码检查,进而上传任意类型的文件!)
检测方法(针对excel)
- 通过文件扩展名判断是03的excel文件还是07的excel文件
- 根据不同的文件,获取不同文件的二进制数据,和file_signature进行对比,我截了03和07的excel的二进制数据图,大家可以参考一下,工具是madedit
- 03的excel
- 07的excel(07可以参考zip检测)
检测程序
/**
* Detect upload file type
*
* @param array $file
* @return bool $flag
*/
private function detectUploadFileMIME($file) {
// 1.through the file extension judgement 03 or 07
$flag = 0;
$file_array = explode ( ".", $file ["name"] );
$file_extension = strtolower ( array_pop ( $file_array ) );
// 2.through the binary content to detect the file
switch ($file_extension) {
case "xls" :
// 2003 excel
$fh = fopen ( $file ["tmp_name"], "rb" );
$bin = fread ( $fh, 8 );
fclose ( $fh );
$strinfo = @unpack ( "C8chars", $bin );
$typecode = "";
foreach ( $strinfo as $num ) {
$typecode .= dechex ( $num );
}
if ($typecode == "d0cf11e0a1b11ae1") {
$flag = 1;
}
break;
case "xlsx" :
// 2007 excel
$fh = fopen ( $file ["tmp_name"], "rb" );
$bin = fread ( $fh, 4 );
fclose ( $fh );
$strinfo = @unpack ( "C4chars", $bin );
$typecode = "";
foreach ( $strinfo as $num ) {
$typecode .= dechex ( $num );
}
echo $typecode;
if ($typecode == "504b34") {
$flag = 1;
}
break;
}
// 3.return the flag
return $flag;
}
参考链接
文件类型对照表 |
|
|