SQL Server死锁问题的解决与分析1

reko_3 发表于 2016-11-5 07:49:29

引用：http://database.iyunv.com/art/201006/208602.htm

此文章主要向大家讲述的之分析与正确解决SQL Server死锁问题，SQL
Server数据库死锁，通俗的讲就是两个或多个trans，同时请求对方正在请求的某个实际应用对象，而导致双方互相等待。简单的例子如下：



[*]

trans1trans2 
[*]

IDBConnection.BeginTransactionIDBConnection.BeginTransaction

[*]

updatetableA2.updatetableB

[*]

updatetableB3.updatetableA

[*]

IDBConnection.Commit4.IDBConnection.Commit





那么，很容易看到，如果trans1和trans2，分别到达了step3，那么trans1会请求对于B的X锁，trans2会请求对于A的X锁，而二者的锁在step2上已经被对方分别持有了。由于得不到锁，后面的Commit无法执行，这样双方开始死锁。



好，我们看一个简单的例子，来解释一下，应该如何解决死锁问题。





[*]

--Batch#1

[*]

CREATEDATABASEdeadlocktest

[*]

GO 
[*]

USEdeadlocktest 
[*]

SETNOCOUNTON

[*]

DBCCTRACEON(1222,-1)





在SQL2005中，增加了一个新的dbcc参数，就是1222，原来在2000下，我们知道，可以执行dbcc



traceon(1204,3605,-1)看到所有的SQL Server死锁信息。SqlServer
2005中，对于1204进行了增强，这就是1222。





[*]

GO
[*]

IFOBJECT_ID('t1')ISNOTNULLDROPTABLEt1

[*]

IFOBJECT_ID('p1')ISNOTNULLDROPPROCp1

[*]

IFOBJECT_ID('p2')ISNOTNULLDROPPROCp2

[*]

GO 
[*]

CREATETABLEt1(c1int,c2int,c3int,c4char(5000))

[*]

GO 
[*]

DECLARE@xint

[*]

SET@x=1
[*]

WHILE(@x<=1000)BEGIN

[*]

INSERTINTOt1VALUES(@x*2,@x*2,@x*2,@x*2)

[*]

SET@x=@x+1

[*]

END 
[*]

GO 
[*]

CREATECLUSTEREDINDEXcidxONt1(c1)

[*]

CREATENONCLUSTEREDINDEXidx1ONt1(c2)

[*]

GO 
[*]

CREATEPROCp1@p1intASSELECTc2,c3FROMt1WHEREc2BETWEEN@p1AND@p1+1

[*]

GO 
[*]

CREATEPROCp2@p1intAS

[*]

UPDATEt1SETc2c2=c2+1WHEREc1=@p1

[*]

UPDATEt1SETc2c2=c2-1WHEREc1=@p1

[*]

GO





上述sql创建一个deadlock的示范数据库，插入了1000条数据，并在表t1上建立了c1列的聚集索引，和c2列的非聚集索引。另外创建了两个sp，分别是从t1中select数据和update数据。



好，打开一个新的查询窗口，我们开始执行下面的query：





[*]

--Batch#2

[*]

USEdeadlocktest 
[*]

SETNOCOUNTON

[*]

WHILE(11=1)EXECp24

[*]

GO





开始执行后，然后我们打开第三个查询窗口，执行下面的query：





[*]

--Batch#3

[*]

USEdeadlocktest 
[*]

SETNOCOUNTON

[*]

CREATETABLE#t1(c2int,c3int)

[*]

GO 
[*]

WHILE(11=1)BEGIN

[*]

INSERTINTO#t1EXECp14

[*]

TRUNCATETABLE#t1

[*]

END 
[*]

GO





开始执行，哈哈，很快，我们看到了这样的错误信息：





[*]

Msg1205,Level13,State51,Procedurep1,Line4

[*]

Transaction(ProcessID54)wasdeadlockedonlockresourceswithanother

[*]

processandhasbeenchosenasthedeadlockvictim.Rerunthetransaction.





spid54发现了SQL Server死锁。



那么，我们该如何解决它？



在SqlServer 2005中，我们可以这么做：



1.在trans3的窗口中，选择EXEC p1 4，然后right click，看到了菜单了吗？选择Analyse Query in
Database Engine Tuning Advisor。



2.注意右面的窗口中，wordload有三个选择：负载文件、表、查询语句，因为我们选择了查询语句的方式，所以就不需要修改这个radio
option了。



3.点左上角的Start Analysis按钮



4.抽根烟，回来后看结果吧！出现了一个分析结果窗口，其中，在Index
Recommendations中，我们发现了一条信息：大意是，在表t1上增加一个非聚集索引索引：t2+t1。



5.在当前窗口的上方菜单上，选择Action菜单，选择Apply Recommendations，系统会自动创建这个索引。



重新运行batch #3，呵呵，死锁没有了。



这种方式，我们可以解决大部分的Sql Server死锁问题。那么，发生这个死锁的根本原因是什么呢？为什么增加一个non
clustered index，问题就解决了呢？



这次，我们分析一下，为什么会SQL Server死锁呢？再回顾一下两个sp的写法：





[*]

CREATEPROCp1@p1intAS
[*]

SELECTc2,c3FROMt1WHEREc2BETWEEN@p1AND@p1+1

[*]

GO 
[*]

CREATEPROCp2@p1intAS

[*]

UPDATEt1SETc2c2=c2+1WHEREc1=@p1

[*]

UPDATEt1SETc2c2=c2-1WHEREc1=@p1

[*]

GO





很奇怪吧！p1没有insert，没有delete，没有update，只是一个select，p2才是update。这个和我们前面说过的，trans1里面updata
A，update B；trans2里面upate B，update A，根本不贴边啊！



那么，什么导致了死锁？



需要从事件日志中，看sql的死锁信息：





[*]

SpidXisrunningthisquery(line2ofproc,inputbuffer“…EXECp14…”):
[*]

SELECTc2,c3FROMt1WHEREc2BETWEEN@p1AND@p1+1

[*]

SpidYisrunningthisquery(line2ofproc,inputbuffer“EXECp24”):
[*]

UPDATEt1SETc2c2=c2+1WHEREc1=@p1

[*]

TheSELECTiswaitingforaSharedKEYlockonindext1.cidx.TheUPDATEholdsaconflictingXlock.
[*]

TheUPDATEiswaitingforaneXclusiveKEYlockonindext1.idx1.TheSELECTholdsaconflictingSlock.





首先，我们看看p1的执行计划。怎么看呢？可以执行set statistics profile
on，这句就可以了。下面是p1的执行计划





[*]

SELECTc2,c3FROMt1WHEREc2BETWEEN@p1AND@p1+1

[*]

|--NestedLoops(InnerJoin,OUTERREFERENCES:(,.))

[*]

|--IndexSeek(OBJECT:(.),SEEK:(.>=[@p1]AND.<=[@p1]+(1))ORDEREDFORWARD)

[*]

|--ClusteredIndexSeek(OBJECT:(.),SEEK:(.=.AND=)LOOKUPORDEREDFORWARD)





我们看到了一个nested
loops，第一行，利用索引t1.c2来进行seek，seek出来的那个rowid，在第二行中，用来通过聚集索引来查找整行的数据。这是什么？就是bookmark
lookup啊！为什么？因为我们需要的c2、c3不能完全的被索引t1.c1带出来，所以需要书签查找。



好，我们接着看p2的执行计划。





[*]

UPDATEt1SETc2c2=c2+1WHEREc1=@p1

[*]

|--ClusteredIndexUpdate(OBJECT:(.),OBJECT:(.),SET:(.=))

[*]

|--ComputeScalar(DEFINE:(=))

[*]

|--ComputeScalar(DEFINE:(=.+(1),=CASEWHENCASEWHEN...

[*]

|--Top(ROWCOUNTest0)

[*]

|--ClusteredIndexSeek(OBJECT:(.),SEEK:(.=[@p1])ORDEREDFORWARD)





通过聚集索引的seek找到了一行，然后开始更新。这里注意的是，update的时候，它会申请一个针对clustered
index的X锁的。



实际上到这里，我们就明白了为什么update会对select产生SQL
Server死锁。update的时候，会申请一个针对clustered
index的X锁，这样就阻塞住了（注意，不是死锁！）select里面最后的那个clustered index seek。

死锁的另一半在哪里呢？注意我们的select语句，c2存在于索引idx1中，c1是一个聚集索引cidx。问题就在这里！我们在p2中更新了c2这个值，所以sqlserver会自动更新包含c2列的非聚集索引：idx1。而idx1在哪里？就在我们刚才的select语句中。而对这个索引列的更改，意味着索引集合的某个行或者某些行，需要重新排列，而重新排列，需要一个X锁。



SO………，问题就这样被发现了。



总结一下，就是说，某个query使用非聚集索引来select数据，那么它会在非聚集索引上持有一个S锁。当有一些select的列不在该索引上，它需要根据rowid找到对应的聚集索引的那行，然后找到其他数据。

而此时，第二个的查询中，update正在聚集索引上忙乎：定位、加锁、修改等。但因为正在修改的某个列，是另外一个非聚集索引的某个列，所以此时，它需要同时更改那个非聚集索引的信息，这就需要在那个非聚集索引上，加第二个X锁。select开始等待update的X锁，update开始等待select的S锁，死锁，就这样发生鸟。



那么，为什么我们增加了一个非聚集索引，死锁就消失鸟？我们看一下，按照上文中自动增加的索引之后的执行计划：





[*]

SELECTc2,c3FROMt1WHEREc2BETWEEN@p1AND@p1+1

[*]

|--IndexSeek(OBJECT:(... ),SEEK:(... >=[@p1]AND...<=[@p1]+(1))ORDEREDFORWARD)





哦，对于clustered index的需求没有了，因为增加的覆盖索引已经足够把所有的信息都select出来。就这么简单。



实际上，在sqlserver
2005中，如果用profiler来抓eventid：1222，那么会出现一个死锁的图，很直观的说。



下面的方法，有助于将死锁减至最少（详细情况，请看SQLServer联机帮助，搜索：将SQL Server死锁减至最少即可。



按同一顺序访问对象。



避免事务中的用户交互。



保持事务简短并处于一个批处理中。



使用较低的隔离级别。



使用基于行版本控制的隔离级别。



将 READ_COMMITTED_SNAPSHOT 数据库选项设置为 ON，使得已提交读事务使用行版本控制。



使用快照隔离。



使用绑定连接。

页: [1]

运维网's Archiver

SQL Server死锁问题的解决与分析1