设为首页 收藏本站
查看: 1003|回复: 0

[经验分享] 【MySQL性能优化】改进MySQL Order By Rand()的低效率

[复制链接]

尚未签到

发表于 2018-10-11 08:06:53 | 显示全部楼层 |阅读模式
  点击查看原文
  正 文:
  最近由于需要研究了一下MYSQL的随机抽取实现方法。举个例子,要从tablename表中随机提取一条记录,大家一般的写法就是:
  SELECT * FROM content ORDER BY RAND() LIMIT 1
  。
  【飘易注:3万条记录查询花费 0.3745 秒(下同);从mysql slow query log看出“ORDER BY RAND() ”全表扫描了2次!】后来我查了一下MYSQL的官方手册,里面针对RAND()的提示大概意思就是,在ORDER BY从句里面不能使用RAND()函数,因为这样会导致数据列被多次扫描。但是在MYSQL 3.23版本中,仍然可以通过ORDER BY RAND()来实现随机。但是真正测试一下才发现这样效率非常低。一个15万余条的库,查询5条数据,居然要8秒以上。查看官方手册,也说rand()放在ORDER BY 子句中会被执行多次,自然效率及很低。搜索Google,采用JOIN,查询max(id) * rand()来随机获取数据。
  SELECT *
  FROM `content` AS t1 JOIN (SELECT ROUND(RAND() * (SELECT MAX(id) FROM `content`)) AS id) AS t2
  WHERE t1.id >= t2.id
  ORDER BY t1.id ASC LIMIT 1;
  【查询花费 0.0008 秒,飘易认为可以推荐使用这个语句!!】但是这样会产生连续的5条记录。解决办法只能是每次查询一条,查询5次。即便如此也值得,因为15万条的表,查询只需要0.01秒不到。有一个方法:
  SELECT * FROM `content` AS a JOIN ( SELECT MAX( ID ) AS ID FROM `content` ) AS b ON ( a.ID >= FLOOR( b.ID * RAND( ) ) ) LIMIT 5;
  上面这种方式保证了一定范围内的随机,查询花费 0.4265 秒,也不推荐。下面的语句,mysql的论坛上有人使用
  SELECT *
  FROM `content`
  WHERE id >= (SELECT FLOOR( MAX(id) * RAND()) FROM `content` )
  ORDER BY id LIMIT 1;
  【查询花费 1.2254 秒,飘易强烈不推荐!因为实测后,3万行的表,这个语句竟然会扫描500万行!!】跟上面的语句还是有很大差距。总觉有什么地方不正常。于是我把语句改写了一下。
  SELECT * FROM `content`
  WHERE id >= (SELECT floor(RAND() * (SELECT MAX(id) FROM `content`)))
  ORDER BY id LIMIT 1;
  【查询花费 0.0012 秒】这下,效率又提高了,查询时间只有0.01秒最后,再把语句完善一下,加上MIN(id)的判断。我在最开始测试的时候,就是因为没有加上MIN(id)的判断,结果有一半的时间总是查询到表中的前面几行。
  完整查询语句是:
  SELECT * FROM `content`
  WHERE id >= (SELECT floor( RAND() * ((SELECT MAX(id) FROM `content`)-(SELECT MIN(id) FROM `content`)) + (SELECT MIN(id) FROM `content`)))
  ORDER BY id LIMIT 1;
  【查询花费 0.0012 秒】
  SELECT *
  FROM `content` AS t1 JOIN (SELECT ROUND(RAND() * ((SELECT MAX(id) FROM `content`)-(SELECT MIN(id) FROM `content`))+(SELECT MIN(id) FROM `content`)) AS id) AS t2
  WHERE t1.id >= t2.id
  ORDER BY t1.id LIMIT 1;
  【查询花费 0.0008 秒】最后在php中对这两个语句进行分别查询10次,
  前者花费时间 0.147433 秒
  后者花费时间 0.015130 秒
  看来采用JOIN的语法比直接在WHERE中使用函数效率还要高很多。(via)======================================
  【好了,最后飘易来总结下】:
  第一种方案,即原始的 Order By Rand() 方法:
  $sql="SELECT * FROM content ORDER BY rand() LIMIT 12";
  $result=mysql_query($sql,$conn);
  $n=1;
  $rnds='';
  while($row=mysql_fetch_array($result)){
  $rnds=$rnds.$n.". ".$row['title']."\n";
  $n++;
  }
  3万条数据查12条随机记录,需要0.125秒,随着数据量的增大,效率越来越低。第二种方案,改进后的 JOIN 方法:
  for($n=1;$n

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-620146-1-1.html 上篇帖子: MySql Host is blocked because of many connection errors 解决方法 下篇帖子: mysql 重装问题
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表