gacvd 发表于 2018-10-1 14:56:00

MySQL建立索引的基础规则

  1、mysql索引(基础与规则)
  索引规则:
  一、 MySQL建表,字段需设置为非空,需设置字段默认值。
  二、 MySQL建表,字段需NULL时,需设置字段默认值,默认值不为NULL。
  三、 MySQL建表,如果字段等价于外键,应在该字段加索引。
  四、 MySQL建表,不同表之间的相同属性值的字段,列类型,类型长度,是否非空,是否默认值,需保持一致,否则无法正确使用索引进行关联对比。
  五、 MySQL使用时,一条SQL语句只能使用一个表的一个索引。所有的字段类型都可以索引,多列索引的属性最多15个。
  六、 如果可以在多个索引中进行选择,MySQL通常使用找到最少行的索引,索引唯一值最高的索引。
  七、 建立索引index(part1,part2,part3),相当于建立了index(part1),index(part1,part2)和index(part1,part2,part3)三个索引。
  八、 MySQL针对like语法必须如下格式才使用索引:SELECT * FROM t1    WHERE key_col LIKE 'ab%' ;
  九、 SELECT COUNT(*) 语法在没有where条件的语句中执行效率没有SELECT COUNT(col_name)快,但是在有where条件的语句中执行效率要快。
  十、 在where条件中多个and的条件中,必须都是一个多列索引的key_part属性而且必须包含key_part1。各自单一索引的话,只使用遍历最少行的那个索引。
  十一、 在where条件中多个or的条件中,每一个条件,都必须是一个有效索引。
  十二、 ORDER BY 后面的条件必须是同一索引的属性,排序顺序必须一致(比如都是升序或都是降序)。
  十三、 所有GROUP BY列引用同一索引的属性,并且索引必须是按顺序保存其关键字的。
  十四、 JOIN 索引,所有匹配ON和where的字段应建立合适的索引。
  十五、 对智能的扫描全表使用FORCE INDEX告知MySQL,使用索引效率更高。
  十六、 定期ANALYZE TABLE tbl_name为扫描的表更新关键字分布 。
  十七、 定期使用慢日志检查语句,执行explain,分析可能改进的索引。
  十八、 条件允许的话,设置较大的key_buffer_size和query_cache_size的值(全局参数),和sort_buffer_size的值(session变量,建议不要超过4M)。
  首先分析项目的数据表,都会有什么样的操作,比如产品列表,会按照分类、品牌等做where,按照时间、价格等排序(order by),所以做索引,个人觉得应该是按照业务逻辑去做。
  索引类型:
  (1)普通索引
  最简单的索引方式,没有太多的约束,创建方式如下:
  创建:create index indexname on tablename(column(length));如果是字符型的字段,要指定length
  (建表时指定)create table tablename ([….],index (column(length));
  修改:alter tablename add index on (column(length))
  删除:drop index indexname on tablename
  (2)唯一索引
  和普通索引的区别就是列值要唯一,允许有空值。(组合索引那组合后的列值也必须唯一)
  创建:create unique index indexname on tablename (column(length))
  (健表时指定)create table ([….],unique (column(length)))
  修改:alter tablename add unique on (column(length))
  (3)主键索引
  主键索引就比较清晰了,大家经常用到,只需要记住两个概念就行了,不能为空,列值唯一。
  当然了,还有就是一个表只能有一个主键。
  (4)全文索引
  Mysql3.23开始支持全文索引,在项目中还真没用过,都用了sphinx全文检索了。所以在此不赘述了。
  
  单列索引和组合索引
  为了描述这两个概念,我们首先建一张测试表
  Create table student(
  Id int not null auto_increment primary key,
  Name char(100) not null,
  Age tinyint not null,
  Score tinyint not null default 0
  )engine=myisam default
  测试表名为student,字段name是名字,age是年龄,score是成绩。

  现在有这么一条查询语句:select>  首先分析单列索引:
  如果在name、age和score的每个字段上建立索引,那就会产生三个结果集,然后再取其交集,最后在得出查询结果
  组合索引:
  Alter table student add index name_age_score on (name(10),age,score);
  建立组合索引,其中name(10),只提取名称的前部分,既能减少索引文件的体积,又能加快插入操作。
  有了组合索引,就相当于有了如下三个索引:
  (name,age,socre)
  (name,age)
  (name)
  这也就是通常所说的“最左前缀”的概念,其实说简单点就是要按照索引的顺序进行排列
  如果有了这个组合索引,那上面那条查询语句一次即可命中
  什么时候用索引
  首先mysql只对,between,in,like使用索引,因此where和join(on)的时候就应该考虑到使用什么样的索引,而且要记住一条sql语句只能使用一个索引,比如有where和order by同时出现的时候,order by 即使用的是索引字段,他也不会走索引。
  索引的弱点
  (1)   加了索引之后,那insert、delete和update操作都要更新索引,会造成一些附加操作
  (2)   索引是保存在物理文件(.MYI)里的,所以如果在一张大表上创建索引,势必会造成索引文件也比较大
2、MySQL优化之索引创建规则

[*]  表的主键、外键必须有索引;
[*]  数据量超过300的表应该有索引;
[*]  经常与其他表进行连接的表,在连接字段上应该建立索引;
[*]  经常出现在Where子句中的字段,特别是大表的字段,应该建立索引;
[*]  索引应该建在选择性高的字段上;
[*]  索引应该建在小字段上,对于大的文本字段甚至超长字段,不要建索引;
[*]  复合索引的建立需要进行仔细分析;尽量考虑用单字段索引代替:

[*]  正确选择复合索引中的主列字段,一般是选择性较好的字段;
[*]  复合索引的几个字段是否经常同时以AND方式出现在Where子句中?单字段查询是否极少甚至没有?如果是,则可以建立复合索引;否则考虑单字段索引;
[*]  如果复合索引中包含的字段经常单独出现在Where子句中,则分解为多个单字段索引;
[*]  如果复合索引所包含的字段超过3个,那么仔细考虑其必要性,考虑减少复合的字段;
[*]  如果既有单字段索引,又有这几个字段上的复合索引,一般可以删除复合索引;

[*]  频繁进行数据操作的表,不要建立太多的索引;
[*]  删除无用的索引,避免对执行计划造成负面影响;
  以上是一些普遍的建立索引时的判断依据。一言以蔽之,索引的建立必须慎重,对每个索引的必要性都应该经过仔细分析,要有建立的依据。因为太多的索引 与不充分、不正确的索引对性能都毫无益处:在表上建立的每个索引都会增加存储开销,索引对于插入、删除、更新操作也会增加处理上的开销。另外,过多的复合 索引,在有单字段索引的情况下,一般都是没有存在价值的;相反,还会降低数据增加删除时的性能,特别是对频繁更新的表来说,负面影响更大。

页: [1]
查看完整版本: MySQL建立索引的基础规则