设为首页 收藏本站
查看: 520|回复: 0

[经验分享] MySQL中order by的实现 和 by rand() 和优化

[复制链接]

尚未签到

发表于 2016-10-23 09:12:28 | 显示全部楼层 |阅读模式
  有同学上周问了个问题 “MySQL 里面的order by rand()”是怎么实现的。我们今天来简单说说MySQL里的order by。
  
  几种order by的情况
    乍一看这个问题好像有点复杂,我们从最简单的case开始看起。
    用这个表来说明:(10w行数据)
http://www.mysqlops.com/wp-content/uploads/2012/05/1.jpg
  
  1、  最简单的order ―― order by索引字段
http://www.mysqlops.com/wp-content/uploads/2012/05/2.jpg
 从explain的结果来看(Extra列),这个语句并不作排序。因为字段a已经是有顺序的。就是按照索引a的顺序依次读pk的值(在这里是隐藏的系统列),一个个从聚簇索引的data中读入。
  
  2、  复杂一点 ―― order by 非索引字段
http://www.mysqlops.com/wp-content/uploads/2012/05/3.jpg
  这里Extra列显示一个Using filesort。这里的filesort并不是指字面上的“文件排序”,说的就是与上面一种情况相比,在Server层作了排序。至于是否使用文件,取决于排序过程中的内存是否足够,不够则需要临时文件。
  
  并不到此为止,我们细细想一下,server层要怎么作排序呢
  一个简单的想法是把表数据都读到内存,然后排序。读到内存当然可以想怎么整就怎么整。但是这个做法很耗费内存。需要占用与表一样大小的内存。
  
  另外一个做法,只读入字段b和其对应的主键id。可以想象为这两个字段构成的结构体,按照b的值作排序。排序完成后,按字段b的顺序依次取主键id,取得结果返回。
  
  实际上第二种作法就是这个例子中的实际执行过程。存放用于排序的字段值的结构我们称为sort_keys.
  至于order by b,c这样的语句,效果与order by b相同,可以简单理解为上面结构体多了一个字段。
  
  3、  字段函数排序
  有了上面的流程,这里就简单了,还是按顺序读入所有的字段b,只是sort_keys中存的是b的长度而已。
http://www.mysqlops.com/wp-content/uploads/2012/05/41.jpg
  
  4、Order by rand()
  按照自然想法, order by rand() 也可以仿照上面描述的做法,对于每一行,将生成的rand()的值放入sort_kyes里即可。但实际上上效果如下:
http://www.mysqlops.com/wp-content/uploads/2012/05/5.jpg
  Extra字段里面有一个Using temporary, 也就是说用到了临时表。那么Using temporary的时候操作流程是怎样的呢?
    a)   创建一个heap引擎的临时表,字段名为 ”” a b c d, 第一个字段为匿名;
    b)   将表tb中的数据按行读入到临时表中,同时给第一字段填入一个随机实数(0,1);
    c)   按照第一个字段排序,返回
    d)   查询完成删除临时表
  分析一下这个过程,由于把数据从InnoDB表里面读入临时表,则InnoDB表实际上也已经读入内存,在这个过程中,若不考虑内存不够时的写文件策略, 则内存中有两份表的全拷贝;另外多了从内存中将数据一一拷贝到临时表的过程。
  
  这个查询在我的测试环境中耗时2.41s(多次次执行,不计第一次加载数据的时间) 
  
  order by rand()的改进
    我们前面说过,实际上对于这种简单的order by rand() 的情况,也可以等同于按照非索引字段来处理。在sort_array 中存入随机值即可。
     按照这个思路的patch在这里,效果上
http://www.mysqlops.com/wp-content/uploads/2012/05/6.jpg
  
    执行时间减少为1.89s,性能提升21%, 这个例子单行1k,单行越大提升效果越好。

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-290080-1-1.html 上篇帖子: MySQL加非聚簇索引造成core dump及简单分析 下篇帖子: 教你优化MySQL查询语句,实现高效分页,轻松响应60W请求
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表