Blue_birds

yangcctv 发表于 2017-12-30 20:42:04

这几天在做数据统计，有几个统计图的需求是这样的：按照年、月、日统计订单数量，比方一年12个月，统计出1月多少订单，二月多少订单，按照这种模式统计。
　　但是数据库里存放的是 timestamp的 current_timestamp 默认值——"2016-12-16 12:30:00"。（这里许多公司会使用时间戳，其实都差不多）
　　当时脑子里想到的第一种做法是，讲所有数据一次性取出来，然后foreach 一个个date()后，得到日期后再一个个去分组。
　　后来考虑到如果数据量大了，性能上会不会出问题。就想到了mysql 内置的FROM_UNIXTIME() 函数然后用一个group by 分组解决。
　　date("Y-m-d", 1481862600) = 2016-12-16 12:30:00
　　FROM_UNIXTIME(add_time, '%Y-%m-%d')
　　为了比较两个函数之间的效率，我做了一个实验，
　　1、创建一张表只有三个字段

　　

CREATE TABLE `t1` (　　`id`
int(11) NOT NULL AUTO_INCREMENT,　　`remark`
char(10) DEFAULT NULL,　　`add_time`
int(11) DEFAULT NULL,PRIMARY KEY (`id`)　　
) ENGINE
=InnoDB AUTO_INCREMENT=458731 DEFAULT CHARSET=latin1;　　

　　2、再用自我复制语句，迅速将表数据复制到了20多万条数据
　　

INSERT INTO t1(remark,add_time) SELECT remark,add_time FROM t1　　

　　3、接下来是PHP的执行代码
　　第一种，使用PHP的date函数循环赋值：
　　

// 获取开始时间的微妙　　
$startTime = (true);
　　
$pdo = new PDO("mysql:host=localhost;dbname=test","root","");

　　
$rs = $pdo -> query("select>　　
$data = $rs->fetchAll();
　　

　　
$php_number_count = 0;
　　
foreach ($data as $item){
　　$php_number_count +=1;
　　$tmp[] = ("Y-m-d", $item['add_time']);
　　
}
　　

　　
echo $php_number_count." ";
　　
echo "开始时间:".$startTime." ";
　　
echo "结束时间:".$endTime = (true). " ";
　　
$resTime = $endTime - $startTime;
　　
echo "用时:".$resTime;exit;
　　

　　输出结果
　　

262144　　
开始时间:
1481871208.7704　　
结束时间:
1481871210.1535　　
用时:
1.3830921649933 秒　　

　　第二种使用mysql的FROM_UNIXTIME()函数
　　

// 获取开始时间的微妙　　
$startTime = (true);
　　
$pdo = new PDO("mysql:host=localhost;dbname=test","root","");

　　
$rs = $pdo -> query("select>　　
$data = $rs->fetchAll();
　　

　　
echo "开始时间:".$startTime." ";
　　
echo "结束时间:".$endTime = (true). " ";
　　
$resTime = $endTime - $startTime;
　　
echo "用时:".$resTime;exit;
　　

　　输出结果：
　　

开始时间:1481871495.7308　　
结束时间:
1481871496.7279　　
用时:
0.99707913398743　　

　　从上面的结果显示明显是使用 mysql的 FROM_UNIXTIME()函数要快一些
　　但是发现在使用PHP的date()函数里多个一个对结果集的foreach 循环，为了保证数据的严谨性，我又再使用 mysql的 FROM_UNIXTIME() 的后面加了一个结果集的foreach循环来尽量保证结果的准确性如下
　　

// ..........　　
$data = $rs->fetchAll();
　　
foreach ($data as $row){
　　$tmp[] = $row['add_time'];
　　
};
　　
// .........
　　

　　结果：
　　

开始时间:1481871764.8102　　
结束时间:
1481871766.0483　　
用时:
1.2380890846252　　

　　为了尽量避免数据的偏差性、不稳定性，每份代码我分别执行了10次，并记录下结果

　　最后得出的结果是，使用FROM_UNIXTIME()函数是速度是最快的，如果group by 后能直接得到想要的结果集，那自然是最好的。
　　不过我们不能忽略mysql数据库执行的开销。毕竟执行中一定程度上会加大数据库的压力。
　　最后这个世界是没有最好的办法，只有最适合的办法。如果哪位大侠有哪种更好的办法，欢迎分享。

页: [1]

运维网's Archiver

Blue_birds