设为首页 收藏本站
查看: 814|回复: 0

[经验分享] Sql Server之旅——第三站 解惑那些背了多年聚集索引的人

[复制链接]

尚未签到

发表于 2015-6-27 09:12:36 | 显示全部楼层 |阅读模式
  说到聚集索引,我想每个码农都明白,但是也有很多像我这样的猥程序员,只能用死记硬背来解决这个问题,什么表中只能建一个聚集索引,
  然后又扯到了目录查找来帮助读者记忆。。。。问题就在这里,我们不是学文科,,,不需要去死记硬背,,,我们需要的就是能看到在眼里面的
  真实东西。。。。。我们都喜欢聚集索引,因为它能够把无序的堆表记录变成有序,还玩起了B树。。。这样就把复杂度从N降低到了LogMN。。。
  这样的话逻辑读,物理读就下来了。
  
  一:现象
  1:无索引的情况
  还是老规矩,看个例子感受下,首先我有一个Product表,里面没有任何索引,如下图:
DSC0000.png
  
  从上图中,我悲剧的看到了,物理读是9次,也就说明走了9次硬盘,你也可以想到,走硬盘的目的是为了拿数据,逻辑读有1636次,要注意的是这里
  的”次“是“页”的意思,也就是在内存中走了1636个数据页,我用dbcc ind 给你看一下,是不是有1636个表数据页。
DSC0001.png
  这里有1637个数据页的原因是第一个是IAM跟踪页。
DSC0002.png
  
  2:有聚集索引的情况
  下面我在Product表中建一个product_idx_productid的聚集索引,然后再次看看io情况,如下图:
DSC0003.png
  当你看到这个”逻辑读“为3次的时候,你是不是已经疯了。。。在多达1636个数据页中找到目标数据,只需3次。。。。这个在算法盲看来是不是神
  仙下凡???当然,,,此物天上有,人间也有。。。既然有,就应该有一种非常强烈的探索欲。。。。看看这里面到底是怎么玩的。。。。。。
  
  二:探索原理
  1: 探索叶子节点
  刚才也说了,聚集索引玩的就是B树,既然是B树,那就有叶子节点和分支节点,专业术语就是度为0的为叶子节点,度>0的叫做分支节点。。。。
  我想你也听说了,聚集索引是将索引列数据进行排序后放入B树,那为了让你眼见为实,我先建立一个ID无序的3条记录。



insert into Person values(2,'bbbbb')
insert into Person values(3,'ccccc')
insert into Person values(1,'aaaaa')
  然后我用dbcc ind 命令查看下3条记录在哪个数据页中,如图:
DSC0004.png
  从图中可以看到,我的三条记录是放在148号数据页中的,然后我导出148号数据页,看看内容是什么。



dbcc traceon(3604)
dbcc page(Ctrip,1,148,1)
DSC0005.png
  从上图中,我们看到了”数据页“中的各个槽位的指向是按照表中的实际存储记录来的,好了,下面我创建个聚集索引,看看实际数据是不是真的有序了?



create clustered index Ctrip_idx_ID on Person(ID)
DSC0006.png
  不过在这里有个有趣的问题,我的148号”表数据页“哪去了???也是够奇葩的,换来的确实173号索引页,那为了保证数据完整性,应该是把
  148号数据页的内容灌到173索引页里面去了吧???? 没关系,验证一下。



1 dbcc traceon(3604)
2 dbcc page(Ctrip,1,173,1)
DSC0007.png
  通过上面的图,有没有直观的感觉到? 数据现在已经是aaaaa,bbbbb,ccccc的模式了。。。有序啦。。。。同时索引页中也保存了148号数据
  页的字段值,比如ID,Name信息,拿下面的slot0槽位举例:
  
DSC0008.png
  
  到此为止,我想你对叶子节点的内容有了个大概的认识,起码没有让你死记硬背了~~~
  
  2 :探索分支节点
  为了让你看到分支节点,我得多灌一些数据进去,好歹要让数据撑破一个索引数据页,这样分支节点索引数据页就出来了,看下面的例子:
DSC0009.png
  从图中可以看到,当我插入1000条数据的时候,已经出现了一个分支节点(120号索引数据页),三个叶子节点(173,121,126),叶子
  节点的数据页内容我也说过了,现在我很好奇”分支节点“中保存着什么内容???我好兴奋,我要导出120号索引数据页了。。。



1 dbcc traceon(3604)
2 dbcc page(Ctrip,1,120,1)
DSC00010.png
  简单分析下slot0:06000000 00ad0000 000100 的内容
  00000000:叶子索引页中的最小key值(这里有点特殊,除一行记录不是保存最小值以外,其余都是的),转换为十进制就是0。
  ad000000:叶子索引页的页号,转换为十进制就是173。
  0100:叶子索引页的文件号,转换为十进制就是1.
  不过通过分析,我们看到了,其实分支节点中保存着有两个值,一个childpage的minkey,一个childpage的pageid,同理,其他的槽位也是这样。
  我们换个参数命令,让结果更直观点,记录中就是保存着”pageID“和”minKey“。
DSC00011.png
  
  这样的话,我脑海中就有一张图出来了,不知道你现在是否有了????
DSC00012.png
  通过上面的分析,除了第一行记录不是保存子索引页中最小key的值外,其他记录都是提取子索引页中的最小索引键值,这一点要注意。。。
  也许对sqlserver团队来说,只要判断小于449的话就直接去(1:173)数据页,小于889的直接去(1:121)数据页就可以啦。。。
  
  当你看到这里的时候,不知道你是否已经明白,为什么表中只能有一个聚集索引呢???好了,乱鸡巴扯了好多,希望对你有所帮助。

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-80878-1-1.html 上篇帖子: SQL Server datetime数据类型设计、优化误区 下篇帖子: [SQL SERVER系列]工作经常使用的SQL整理,实战篇(二)[原创]
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表