yangcctv 发表于 2017-12-30 20:42:04

Blue_birds

  这几天在做数据统计,有几个统计图的需求是这样的: 按照年、月、日统计订单数量, 比方一年12个月,统计出1月多少订单,二月多少订单,按照这种模式统计。
  但是数据库里存放的是 timestamp的 current_timestamp 默认值——"2016-12-16 12:30:00"。(这里许多公司会使用时间戳,其实都差不多)
  当时脑子里想到的第一种做法是,讲所有数据一次性取出来,然后foreach 一个个date()后,得到日期后再一个个去分组。
  后来考虑到如果数据量大了,性能上会不会出问题。就想到了mysql 内置的FROM_UNIXTIME() 函数 然后用一个group by 分组解决。
  date("Y-m-d", 1481862600) = 2016-12-16 12:30:00
  FROM_UNIXTIME(add_time, '%Y-%m-%d')
  为了比较两个函数之间的效率,我做了一个实验,
  1、创建一张表 只有三个字段

  

CREATE TABLE `t1` (  `id`
int(11) NOT NULL AUTO_INCREMENT,  `remark`
char(10) DEFAULT NULL,  `add_time`
int(11) DEFAULT NULL,PRIMARY KEY (`id`)  
) ENGINE
=InnoDB AUTO_INCREMENT=458731 DEFAULT CHARSET=latin1;  

  2、再用自我复制语句,迅速将表数据复制到了20多万条数据
  

INSERT INTO t1(remark,add_time) SELECT remark,add_time FROM t1  

  3、接下来是PHP的执行代码
  第一种,使用PHP的date函数循环赋值:
  

// 获取开始时间的微妙  
$startTime = (true);
  
$pdo = new PDO("mysql:host=localhost;dbname=test","root","");

  
$rs = $pdo -> query("select>  
$data = $rs->fetchAll();
  

  
$php_number_count = 0;
  
foreach ($data as $item){
  $php_number_count +=1;
  $tmp[] = ("Y-m-d", $item['add_time']);
  
}
  

  
echo $php_number_count."<br>";
  
echo "开始时间:".$startTime."<br>";
  
echo "结束时间:".$endTime = (true). "<br>";
  
$resTime = $endTime - $startTime;
  
echo "用时:".$resTime;exit;
  

  输出结果
  

262144  
开始时间:
1481871208.7704  
结束时间:
1481871210.1535  
用时:
1.3830921649933 秒  

  第二种使用mysql的FROM_UNIXTIME()函数
  

// 获取开始时间的微妙  
$startTime = (true);
  
$pdo = new PDO("mysql:host=localhost;dbname=test","root","");

  
$rs = $pdo -> query("select>  
$data = $rs->fetchAll();
  

  
echo "开始时间:".$startTime."<br>";
  
echo "结束时间:".$endTime = (true). "<br>";
  
$resTime = $endTime - $startTime;
  
echo "用时:".$resTime;exit;
  

  输出结果:
  

开始时间:1481871495.7308  
结束时间:
1481871496.7279  
用时:
0.99707913398743  

  从上面的结果显示明显是 使用 mysql的 FROM_UNIXTIME()函数要快一些
  但是发现在使用PHP的date()函数里 多个一个对结果集的foreach 循环,为了保证数据的严谨性,我又再 使用 mysql的 FROM_UNIXTIME() 的后面加了一个结果集的foreach循环来尽量保证结果的准确性 如下
  

// ..........  
$data = $rs->fetchAll();
  
foreach ($data as $row){
  $tmp[] = $row['add_time'];
  
};
  
// .........
  

  结果:
  

开始时间:1481871764.8102  
结束时间:
1481871766.0483  
用时:
1.2380890846252  

  为了尽量避免数据的偏差性、不稳定性,每份代码我分别执行了10次,并记录下结果

  最后得出的结果是, 使用FROM_UNIXTIME()函数 是速度是最快的,如果group by 后能直接得到想要的结果集,那自然是最好的。
  不过我们不能忽略mysql数据库执行的开销。毕竟执行中一定程度上会加大数据库的压力。
  最后这个世界是没有最好的办法,只有最适合的办法。 如果哪位大侠有哪种更好的办法,欢迎分享。
页: [1]
查看完整版本: Blue_birds