设为首页 收藏本站
查看: 1257|回复: 0

[经验分享] mysql--索引原理

[复制链接]

尚未签到

发表于 2017-12-12 14:32:52 | 显示全部楼层 |阅读模式
  MySQL索引原理
  索引目的
  索引的目的在于提高查询效率,可以类比字典,如果要查“mysql”这个单词,我们肯定需要定位到m字母,然后从下往下找到y字母,再找到剩下的sql。如果没有索引,那么你可能需要把所有单词看一遍才能找到你想要的,如果我想找到m开头的单词呢?或者ze开头的单词呢?是不是觉得如果没有索引,这个事情根本无法完成?
  索引原理
  除了词典,生活中随处可见索引的例子,如火车站的车次表、图书的目录等。它们的原理都是一样的,通过不断的缩小想要获得数据的范围来筛选出最终想要的结果,同时把随机的事件变成顺序的事件,也就是我们总是通过同一种查找方式来锁定数据。
  数据库也是一样,但显然要复杂许多,因为不仅面临着等值查询,还有范围查询(>、<、between、in)、模糊查询(like)、并集查询(or)等等。数据库应该选择怎么样的方式来应对所有的问题呢?我们回想字典的例子,能不能把数据分成段,然后分段查询呢?最简单的如果1000条数据,1到100分成第一段,101到200分成第二段,201到300分成第三段……这样查第250条数据,只要找第三段就可以了,一下子去除了90%的无效数据。但如果是1千万的记录呢,分成几段比较好?稍有算法基础的同学会想到搜索树,其平均复杂度是lgN,具有不错的查询性能。
  Msyql支持多种类型的索引:BTree索引,hash索引,全文索引.平时用的最多的是BTree索引
  附:
  B树
  即二叉搜索树:
  1.所有非叶子结点至多拥有两个儿子(Left和Right);
  2.所有结点存储一个关键字;
  3.非叶子结点的左指针指向小于其关键字的子树,右指针指向大于其关键字的子树;
  如:
DSC0000.png

  B树的搜索,从根结点开始,如果查询的关键字与结点的关键字相等,那么就命中;否则,如果查询关键字比结点关键字小,就进入左儿子;如果比结点关键字大,就进入右儿子;如果左儿子或右儿子的指针为空,则报告找不到相应的关键字;
  如果B树的所有非叶子结点的左右子树的结点数目均保持差不多(平衡),那么B树的搜索性能逼近二分查找;但它比连续内存空间的二分查找的优点是,改变B树结构(插入与删除结点)不需要移动大段的内存数据,甚至通常是常数开销;
  如:
DSC0001.png

  但B树在经过多次插入与删除后,有可能导致不同的结构:
DSC0002.png

  右边也是一个B树,但它的搜索性能已经是线性的了;同样的关键字集合有可能导致不同的树结构索引;所以,使用B树还要考虑尽可能让B树保持左图的结构,和避免右图的结构,也就是所谓的“平衡”问题;      
  实际使用的B树都是在原B树的基础上加上平衡算法,即“平衡二叉树”;如何保持B树结点分布均匀的平衡算法是平衡二叉树的关键;平衡算法是一种在B树中插入和删除结点的策略;
  B-树
  是一种多路搜索树(并不是二叉的):
  1.定义任意非叶子结点最多只有M个儿子;且M>2;
  2.根结点的儿子数为[2, M];
  3.除根结点以外的非叶子结点的儿子数为[M/2, M];
  4.每个结点存放至少M/2-1(取上整)和至多M-1个关键字;(至少2个关键字)
  5.非叶子结点的关键字个数=指向儿子的指针个数-1;
  6.非叶子结点的关键字:K[1], K[2], …, K[M-1];且K < K[i+1];
  7.非叶子结点的指针:P[1], P[2], …, P[M];其中P[1]指向关键字小于K[1]的子树,P[M]指向关键字大于K[M-1]的子树,其它P指向关键字属于(K[i-1], K)的子树;
  8.所有叶子结点位于同一层;
  如:(M=3)
DSC0003.png

  B-树的搜索,从根结点开始,对结点内的关键字(有序)序列进行二分查找,如果命中则结束,否则进入查询关键字所属范围的儿子结点;重复,直到所对应的儿子指针为空,或已经是叶子结点;
  B-树的特性:
  1.关键字集合分布在整颗树中;
  2.任何一个关键字出现且只出现在一个结点中;
  3.搜索有可能在非叶子结点结束;
  4.其搜索性能等价于在关键字全集内做一次二分查找;
  5.自动层次控制;
  注:由于限制了除根结点以外的非叶子结点,至少含有M/2个儿子,确保了结点的至少利用率。
  所以B-树的性能总是等价于二分查找(与M值无关),也就没有B树平衡的问题;
  由于M/2的限制,在插入结点时,如果结点已满,需要将结点分裂为两个各占M/2的结点;删除结点时,需将两个不足M/2的兄弟结点合并;
  B+树
  B+树是B-树的变体,也是一种多路搜索树:
  1.其定义基本与B-树同,除了:
  2.非叶子结点的子树指针与关键字个数相同;
  3.非叶子结点的子树指针P,指向关键字值属于[K, K[i+1])的子树(B-树是开区间);
  5.为所有叶子结点增加一个链指针;
  6.所有关键字都在叶子结点出现;
  如:(M=3)
DSC0004.png

  B+的搜索与B-树也基本相同,区别是B+树只有达到叶子结点才命中(B-树可以在非叶子结点命中),其性能也等价于在关键字全集做一次二分查找;
  B+的特性:
  1.所有关键字都出现在叶子结点的链表中(稠密索引),且链表中的关键字恰好是有序的;
  2.不可能在非叶子结点命中;
  3.非叶子结点相当于是叶子结点的索引(稀疏索引),叶子结点相当于是存储(关键字)数据的数据层;
  4.更适合文件索引系统;
  小结
  B树:二叉树,每个结点只存储一个关键字,等于则命中,小于走左结点,大于走右结点;
  B-树:多路搜索树,每个结点存储M/2到M个关键字,非叶子结点存储指向关键字范围的子结点;
  所有关键字在整颗树中出现,且只出现一次,非叶子结点可以命中;
  B+树:在B-树基础上,为叶子结点增加链表指针,所有关键字都在叶子结点中出现,非叶子结点作为叶子结点的索引;
  B+树总是到叶子结点才命中;

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-423356-1-1.html 上篇帖子: sql练习(针对Mysql) 下篇帖子: centOS7.0下安装mysql
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表