设为首页 收藏本站
查看: 736|回复: 0

[经验分享] MySQL SQL优化之‘%’

[复制链接]

尚未签到

发表于 2018-9-27 14:01:01 | 显示全部楼层 |阅读模式
  设计索引的主要目的就是帮助我们快速获取查询结果,而以%开头的like查询则不能够使用B-Tree索引。
  考虑到innodb的表都是聚簇表(类似于oracle中的索引组织表),且二级索引叶节点中记录的结构为(索引字段->主键字段),我们可以通过改写sql(mysql优化器比较笨,需要给它足够的提示)采取一种轻量级的方式代替全表扫:
  使用索引全扫描找到主键,再根据主键回表获取数据的方法。
  这种方式的速度优势在单行记录长度较大、表中记录较多的情况下体现的尤为明显,因为此时索引全扫描带来的IO开销相对于全表扫会小得多。
  纸上得来终觉浅,绝知此事要躬行:
  创建测试表test,表上有自增主键primary(id)和二级索引idx_name1(name1),表中有500万条数据。
  

mysql> desc test;  
+--------+-------------+------+-----+---------+----------------+
  
| Field  | Type        | Null | Key | Default | Extra          |
  
+--------+-------------+------+-----+---------+----------------+

  
|>  
| name1  | varchar(20) | YES  | MUL | NULL    |                |
  
| name2  | varchar(20) | YES  |     | NULL    |                |
  
| name3  | varchar(20) | YES  |     | NULL    |                |
  
| name4  | varchar(20) | YES  |     | NULL    |                |
  
| name5  | varchar(20) | YES  |     | NULL    |                |
  
| name6  | varchar(20) | YES  |     | NULL    |                |
  
| name7  | varchar(20) | YES  |     | NULL    |                |
  
| name8  | varchar(20) | YES  |     | NULL    |                |
  
| name9  | varchar(20) | YES  |     | NULL    |                |
  
| name10 | varchar(20) | YES  |     | NULL    |                |
  
+--------+-------------+------+-----+---------+----------------+
  
11 rows in set (0.01 sec)
  

  
mysql> show index from test\G
  
*************************** 1. row ***************************
  Table: test
  Non_unique: 0
  Key_name: PRIMARY
  Seq_in_index: 1

  Column_name:>  Collation: A
  Cardinality: 4829778
  Sub_part: NULL
  Packed: NULL
  Null:
  Index_type: BTREE
  Comment:
  
Index_comment:
  
*************************** 2. row ***************************
  Table: test
  Non_unique: 1

  Key_name:>  Seq_in_index: 1
  Column_name: name1
  Collation: A
  Cardinality: 2414889
  Sub_part: NULL
  Packed: NULL
  Null: YES
  Index_type: BTREE
  Comment:
  
Index_comment:
  
2 rows in set (0.00 sec)
  

  
mysql> select count(*) from test;
  
+----------+
  
| count(*) |
  
+----------+
  
|  5000000 |
  
+----------+
  
1 row in set (1.59 sec)
  

  基于name1进行like查询,耗时11.13s,从执行计划看,sql在执行时走的是全表扫描(type: ALL):
  

mysql>  select * from test where name1 like '%O4JljqZw%'\G  
*************************** 1. row ***************************
  id: 1167352
  name1: BO4JljqZws
  name2: BrfLU7J69j
  name3: XFikCVEilI
  name4: lr0yz3qMsO
  name5: vUUDghq8dx
  name6: RvQvSHHg4p
  name7: ESiDbQuK8f
  name8: GugFnLtYe8
  name9: OuPwY8BsiY
  
name10: O0oNGPX9IW
  
1 row in set (11.13 sec)
  

  
mysql> explain select * from test where name1 like '%O4JljqZw%'\G
  
*************************** 1. row ***************************
  id: 1
  select_type: SIMPLE
  table: test
  type: ALL
  
possible_keys: NULL
  key: NULL
  key_len: NULL
  ref: NULL
  rows: 4829778
  Extra: Using where
  
1 row in set (0.00 sec)
  

  

  将sql改写为‘select a. from test a,(select>  提示优化器在子查询中使用二级索引idx_name1获取id:
  

mysql> select a.* from test a,(select>
*************************** 1. row ***************************
  id: 1167352
  name1: BO4JljqZws
  name2: BrfLU7J69j
  name3: XFikCVEilI
  name4: lr0yz3qMsO
  name5: vUUDghq8dx
  name6: RvQvSHHg4p
  name7: ESiDbQuK8f
  name8: GugFnLtYe8
  name9: OuPwY8BsiY
  
name10: O0oNGPX9IW
  
1 row in set (2.46 sec)
  


  
mysql> explain select a.* from test a,(select>  
*************************** 1. row ***************************
  id: 1
  select_type: PRIMARY
  table:
  type: ALL
  
possible_keys: NULL
  key: NULL
  key_len: NULL
  ref: NULL
  rows: 4829778
  Extra: NULL
  
*************************** 2. row ***************************
  id: 1
  select_type: PRIMARY
  table: a
  type: eq_ref
  
possible_keys: PRIMARY
  key: PRIMARY
  key_len: 4
  ref: b.id
  rows: 1
  Extra: NULL
  
*************************** 3. row ***************************
  id: 2
  select_type: DERIVED
  table: test
  type: index
  
possible_keys: NULL

  key:>  key_len: 63
  ref: NULL
  rows: 4829778
  Extra: Using where; Using index
  
3 rows in set (0.00 sec)
  

  改写后的sql执行时间缩短至2.46s,效率提升了近4倍!
  执行计划分析如下:
  step 1:mysql先对二级索引idx_name1进行覆盖扫描取出符合条件的id(Using where; Using index)
  step 2:对子step 1衍生出来的结果集table: 进行全表扫,获取id(本案例中只有一个id符合条件)
  step 3:最后根据step 2中的id使用主键回表获取数据(type: eq_ref,key: PRIMARY )
  总结:
  在表中每条记录的长度较大时,通过这种方法改写后的sql效率会有明显提升。
  本实验中每条记录的长度还很小(只有100多字节),如果每条记录的长度进一步加大,改写后sql的执行效率会有数量级的提升,大家可以自行验证~



运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-602893-1-1.html 上篇帖子: mysql dba系统学习(20)mysql存储引擎MyISAM 下篇帖子: 高效MYSQL性能优化--小结
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表