设为首页 收藏本站
查看: 1038|回复: 0

[经验分享] Sql Server 2005 嵌套循环算法

[复制链接]

尚未签到

发表于 2015-7-3 07:09:36 | 显示全部楼层 |阅读模式
   前段时间看了一篇关于算法的blog,地址如下:
  http://www.iyunv.com/perfectdesign/archive/2008/04/24/sql_tuning.html
  
  不少人也给了解决方法,以前也研究过(嵌套,合并,hash)算法,但没有真正的用到优化中,这个例子给了我很大启示。
    现在就讨论一下这三个算法的使用。
  嵌套循环
  算法:
  for each row R1 in the outer table     
  for each row R2 in the inner table
  if R1 joins with R2
  return (R1, R2)
  嵌套循环:适合小输入的表,输出也是小输出的数据量
  外部循环逐行处理外部输入表。内部循环会针对每个外部行执行,在内部输入表中搜索匹配行。
  SQL Server 帮助文档中介绍:
最佳使用: 如果外部输入较小而内部输入较大且预先创建了索引,则嵌套循环联接尤其有效。在许多小事务中(如那些只影响较小的一组行的事务),索引嵌套循环联接优于合并联接和哈希联接。但在大型查询中,嵌套循环联接通常不是最佳选择。


  例子:表:workflowinfo1 约45万条 表workflowbase1 约4.5万条
      条件:workflowbase1中列id,creater都建立索引,workflowinfo1中workflowid建立了索引。
测试SQL语句:

注意

1,测试条件:(creater='402881411023dcc001102e3bbbc505c7'的workflowbase1表只有2条数据)

嵌套循环:

select * from workflowbase1 a inner loop join dbo.workflowinfo1 b

on a.id=b.workflowid and a.creater='402881411023dcc001102e3bbbc505c7'

合并连接

select * from workflowbase1 a inner merge join dbo.workflowinfo1 b

on a.id=b.workflowid and a.creater='402881411023dcc001102e3bbbc505c7'

hash连接

select * from workflowbase1 a inner hash join dbo.workflowinfo1 b

  on a.id=b.workflowid and a.creater='402881411023dcc001102e3bbbc505c7'
  
   对比SQL语句成本
DSC0000.jpg
  
  
  这里返回的结果

(5 行受影响)

表'workflowinfo1'。扫描计数2,逻辑读取11 次,物理读取2 次,预读16 次,lob 逻辑读取0 次,lob 物理读取0 次,lob 预读0 次。

表'workflowbase1'。扫描计数1,逻辑读取5 次,物理读取3 次,预读0 次,lob 逻辑读取0 次,lob 物理读取0 次,lob 预读0 次。


这里返回了5条数据。


这里在看一下输入很多条数据时:

1,测试条件:(creater=4028814110830a1e01108fe379e60061’的workflowbase1表有1023条数据)

   为避免上一次绑定变量的影响,重启数据库服务。对比成本


   DSC0001.jpg

这时发现嵌套循环不是最优的算法:hash连接才是。


我们看看具体的执行结果:


(10468 行受影响)

表'workflowinfo1'。扫描计数1023,逻辑读取13843 次,物理读取0 次,预读0 次,lob 逻辑读取0 次,lob 物理读取0 次,lob 预读0 次。

表'workflowbase1'。扫描计数1,逻辑读取1571 次,物理读取0 次,预读0 次,lob 逻辑读取0 次,lob 物理读取0 次,lob 预读0 次。


(10468 行受影响)

表'workflowbase1'。扫描计数3,逻辑读取1571 次,物理读取0 次,预读0 次,lob 逻辑读取0 次,lob 物理读取0 次,lob 预读0 次。

表'workflowinfo1'。扫描计数3,逻辑读取9604 次,物理读取0 次,预读0 次,lob 逻辑读取0 次,lob 物理读取0 次,lob 预读0 次。


(10468 行受影响)

表'Worktable'。扫描计数0,逻辑读取0 次,物理读取0 次,预读0 次,lob 逻辑读取0 次,lob 物理读取0 次,lob 预读0 次。

表'workflowinfo1'。扫描计数1,逻辑读取9604 次,物理读取0 次,预读0 次,lob 逻辑读取0 次,lob 物理读取0 次,lob 预读0 次。

表'workflowbase1'。扫描计数1,逻辑读取1571 次,物理读取0 次,预读0 次,lob 逻辑读取0 次,lob 物理读取0 次,lob 预读0 次。


嵌套循环:IO次数:13843+1571=15414次

    合并,Hash连接:IO次数:9604+1571=11175次


这里的嵌套循环计数为1023次,从上面的嵌套循环算法可以看出:从表'workflowbase1'取出1023条,再逐条循环去对比'workflowinfo1'里的数据,有的话返回行。 由于合并算法也排序,这里的成本,hash连接要比合并要高效。


从这里可以看出嵌套循环适合适合小输入的表,输出也是小输出的数据量的情况,不适合查询出大数据量

同时输出的数据也是排过序的(通过索引(排序)去找数据)

如果一个联接输入很小(不到 10 行),而另一个联接输入很大而且已在其联接列上创建了索引,则索引 Nested Loops 连接是最快的联接操作。


由于嵌套循环相对其他两个算法。合并算法(必须按相等列分别排序),hash(必须列相等连接,而不是类似left(1,3)函数相等)是有条件限制的,一般嵌套循环在实际使用中会比较多。

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-82665-1-1.html 上篇帖子: Sql Server 2005 中的row_number()分页技术 下篇帖子: SQL Server 2005 如何实现ACID事务机制
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表