设为首页 收藏本站
查看: 874|回复: 0

[经验分享] mysql组内排序取最大值

[复制链接]

尚未签到

发表于 2018-10-10 08:27:17 | 显示全部楼层 |阅读模式
  最近业务反馈一个查询异常的问题,需要DBA对查询结果异常给出解释,并帮助他们解决该问题。问题本质是一个组内排序取最大值的问题,根据业务需求,我构建了测试用例
测试用例
--建表  
create table testorder
  
(id int not null,
  
no int not null,
  
name char(10) not null,
  
primary key(id)
  
)engine=innodb;
  
--写入数据
  
insert into testorder values (1,1,'Mike'),(2,2,'John'),(3,3,'wyett'),(4,4,'Herry'),(5,5,'Mike'),(6,1,'John'),(7,2,'John'),(8,1,'Mike'),(9,1,'Mike');
  
--查询1
  
select * from testorder;
  
+----+----+-------+
  
| id | no | name  |
  
+----+----+-------+
  
|  1 |  1 | Mike  |
  
|  2 |  2 | John  |
  
|  3 |  3 | wyett |
  
|  4 |  4 | Herry |
  
|  5 |  5 | Mike  |
  
|  6 |  1 | John  |
  
|  7 |  2 | John  |
  
|  8 |  1 | Mike  |
  
|  9 |  1 | Mike  |
  
+----+----+-------+
  
--查询2
  
select * from testorder order by no desc;
  
+----+----+-------+
  
| id | no | name  |
  
+----+----+-------+
  
|  5 |  5 | Mike  |
  
|  4 |  4 | Herry |
  
|  3 |  3 | wyett |
  
|  2 |  2 | John  |
  
|  7 |  2 | John  |
  
|  1 |  1 | Mike  |
  
|  6 |  1 | John  |
  
|  8 |  1 | Mike  |
  
|  9 |  1 | Mike  |
  
+----+----+-------+
  
--查询3select * from (select id,no,name from testorder order by no desc)a group by a.name;
  查询3这条SQL是我们需要讨论的内容,也是业务线为实现组内排序取最大值所采用的SQL。标准的程序员反馈问题方式:XXX时间点之前查询时正常的,这之后突然就不正常了,你们DBA是不是做什么改动了?我把数据恢复到自己的测试机,返回值也是正常的。暂且不去管姿势是否正确,对这条SQL的分析,我们其实可以看出:(1)程序员期待group by执行结果是按照临时表a的数据顺序来取值;(2)程序员未考虑版本因素,数据量变化的因素;为此,我构建了上面的测试用例。
测试
  在不同版本的MySQL来进行测试:发现在Percona 5.5,Percona 5.1,MySQL 5.6关闭sql_mode= ONLY_FULL_GROUP_BY,MySQL5.1等版本下,返回值确如程序员期待的顺序,按照order by no desc的顺序,相同name返回no值最大的数据;
+----+----+-------+  
| id | no | name  |
  
+----+----+-------+
  
|  4 |  4 | Herry |
  
|  2 |  2 | John  |
  
|  5 |  5 | Mike  |
  
|  3 |  3 | wyett |
  
+----+----+-------+
  在mysql5.7,关闭sql_mode= ONLY_FULL_GROUP_BY和mariadb 10.*版本中,相同的name值,返回则是取了最早写入的数据行,忽略了order by no desc,按照数据的逻辑存储顺序来返回;
+----+----+-------+  
| id | no | name  |
  
+----+----+-------+
  
|  4 |  4 | Herry |
  
|  2 |  2 | John  |
  
|  1 |  1 | Mike  |
  
|  3 |  3 | wyett |
  
+----+----+-------+

  其实在这里,SQL等价于select>  这里我们看出不同版本的返回值是不同的,先搁置数据量的变化引起执行结果不同的讨论,因为数据量大小很难测试。
官方文档
  对上面的测试结果,在官方文档上,有如下的参考
If ONLY_FULL_GROUP_BY is disabled...In this case, the server is free to choose any value from each group,  
so unless they are the same, the values chosen are indeterminate, which is probably not what you want.
  
Furthermore, the selection of values from each group cannot be influenced by adding an ORDER BY clause.
  
Result set sorting occurs after values have been chosen, and ORDER BY does not affect which value within
  
each group the server chooses.
  ONLY_FULL_GROUP_BY这个SQL_MODE出在mysql5.6(mariadb 10.0)时被引入,但本文讨论的内容和它无关,具体可以自己查看文档,这里不做讨论。在5.6,5.5的官方文档有相同的内容,Mariadb也有类似的解释
If you select a non-grouped column or a value computed from a non-grouped column, it is undefined  
which row the returned value is taken from. This is not permitted if the ONLY_FULL_GROUP_BY SQL_MODE is used.
  并且,对from后的subquery子表中的order by也给出了解释
A query such as  

  
SELECT field1, field2 FROM ( SELECT field1, field2 FROM table1 ORDER BY field2 ) alias
  
returns a result set that is not necessarily ordered by field2. This is not a bug.
  

  
A "table" (and subquery in the FROM clause too) is - according to the SQL standard - an unordered set of rows.
  
Rows in a table (or in a subquery in the FROM clause) do not come in any specific order.
  好了,有了这些解释,问题很明朗:

  •   在from 后的subquery中的order by会被忽略
  •   group by cloumn返回的行是无序的
  因此,业务获得的正确的返回值也是误打误撞。
解决办法
  那么这个问题该怎么解决?
  在网上有一些SQL,很明显不满足需求,在这里做一下展示,希望同学们避免被误导:
  错误SQL集合
select id,sbustring(GROUP_CONCAT(distinct no order by no desc separator ''),'',1),name from testorder group by name;--通过添加索引来影响返回的结果集顺序  
alter table testorder add index idx_no_name(no desc, name);
  
--结果证明即使如此,desc也不会被正确执行;
--我司程序员的写法  
select * from (select id,no,name from testorder order by no desc)a group by a.name
select id,max(no),name from testorder group by name  我们可以这样写,虽然效率不高
select a.id,a.no,a.name  
from testorder a
  
inner join (select max(no) no,name
  
            from testorder
  group by name) b on a.no=b.no and a.name=b.name
  
group by name,no
  或者这样
select a.id,a.no,a.name  
from testorder a
  
group by a.name,a.no
  
having a.no=(select max(no) from testorder where name=a.name)



运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-619740-1-1.html 上篇帖子: zabbix----4-----监控mysql 下篇帖子: mysql 分库备份脚本
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表