设为首页 收藏本站
查看: 3229|回复: 0

[经验分享] DB2 db2diag.log 日志分析 (转)

[复制链接]
累计签到:1 天
连续签到:1 天
发表于 2016-11-15 06:00:32 | 显示全部楼层 |阅读模式
  1、db2diag.log日志文件说明  
  db2diag.log是用来记录DB2数据库运行中的信息的文件。可以通过此文件,查看记录的有关DB2数据库详细的错误信息。此文件也是不断增大的,需要定期进行清理。 可以通过查看实例的配置参数DIAGPATH,来确定db2diag.log文件是放在哪个目录下:

db2 get dbm cfg 
  如果

Diagnostic data directory path(DIAGPATH) = /home/db2inst1/sqllib/db2dump
  则此文件是放在   /home/db2inst1/sqllib/db2dump   目录下。
  当文件系统/home的使用率达到80%-90%左右时,应及时删除db2diag.log文件。 请按以下正确步骤操作:确认应用、DB2已经停止。将原db2diag.log文件备份到其它文件系统下。 删除db2diag.log文件。删除后,DB2会自动创建一个新的文件。
      注意:如果你觉得以上操作不保险的话,DB2提供了自动归档db2diag.log的命令db2diag -a 自动将该文件以日期时间命名
下面是查看该文件时经常会碰到的一个片段(蓝色部分是为了便于讲解而加上去的编号):

-----------------------------------------------
2003-04-24-13.56.13.453290(1)
Instance:svtdbm2(2)
Node:100(3)
PID:672(db2agent (SUN102) 100)(4)
TID:1(5)
Appid:*N100.svtdbm2.0074F4174930(6)
buffer pool services(7)
sqlbCheckAllocation(8)
Probe:800(9)
Database:SUN102(10)
-----------------------------------------------
  
上面的蓝色部分分别如下含义:
  1) timestamp (时间戳)
  2) instance (数据库实例)
  3) partition number (分区号)
  4) process and database (进程和数据库)
  5) thread Id (线程ID)
  6) application ID (应用程序ID)
  7) component (组件)
  8) function (函数)
  9) internal error point (内部错误指针)
  10) database (数据库)
了解这些基本含义有助于分析和诊断DB2的相关问题。
  2. 要显示 db2diag.log 文件中所有关于 119664 进程的信息,可利用以下命令:

db2diag -pid 119664
  显示如下:

2004-10-11-19.01.56.555034-300 I7109918C313 LEVEL: Event PID : 119664 TID : 1
PROC : db2star2 INSTANCE: dimi NODE : 000 FUNCTION: DB2 UDB, config/install,
sqlfLogUpdateCfgParam, probe:30 CHANGE : CFG DBM: "Instance_Memory" <automatic>
From: "11126" To: "11126" ....
  通过

db2diag -pid 119664 -n 0,4
  命令将抽取 db2diag.log 文件中分区 0 和 4 上所有 119664 进程的相关信息:

     3. 为显示 db2diag.log 文件中包含的时间戳“2004-11-02-11.00.907665-360”之后的所有信息,可用下述命令:

db2diag -time 2004-11-02-11.00.907665-360
  
    4. 另外一个较有用的选项是“-rc”。对于以前的 DB2 版本,用户经常希望了解的 db2diag.log 中的常出现十六进制返回码所提示的信息,在 v8.2 上,如果使用该选项便可得到关于这些十六进制返回码的解释。如对于以下一段信息:

2004-10-19-12.19.46.033037-300 I7202340C354 LEVEL: Severe PID : 139048 ID : 1
PROC : db2hmon 4 INSTANCE: dimi NODE : 000 FUNCTION: DB2 UDB, outine_infrastructure,
sqlerFmpOneTimeInit, probe:100 MESSAGE : DiagData ATA #1 : Hexdump,
4 bytes 0x2FF225B0 : FFFF FBEE .... ......
  
为了解十六进制 0xFFFF FBEE 所提示的信息,可使用下面的命令:

db2diag -rc FFFFFBEE
  
其输出为:

Input ECF string 'FFFFFBEE' parsed as 0xFFFFFBEE (-1042). ERROR: ../sqz/sqlzwhatisrc.C:
Input ZRC 0xFFFFFBEE (-1042) cannot be identified as a V7 or V6 ZRC value
  
即该返回码提示的错误码为:SQL1042C,用户可使用:

db2 "? sql1042"
  
获得关于这个错误的具体解释。

     5. 为显示 db2diag.log 中所记录的严重错误,使用:

db2diag -gi "level=severe"
  
输出可参看例 4 中提供的。

如果要得到有关该工具的更多选项的帮助信息,可使用:

db2diag -h
  
使用db2diag工具的高级选项过滤查找db2diag.log诊断日志记录
内容 提要 db2diag.log是DB2中非常重要的诊断日志,一般出现问题后,首先就要查看db2diag.log文件。但是很多时候特别是在多分区数据库中,查看db2diag.log变得非常费时。因为所有分区所有应用程序的诊断日志都会写到DB2的诊断日志中。从DB2版本8.2开始,DB2提供了db2diag工具可以用来过滤查找特定的日志,有时候我们需要做一些更高级的过滤查询,以便帮助我们进一步诊断问题,该文章通过例子对于db2diag中的高级选项做了介绍。 正文 首先简单介绍db2diag.log中的条目构成,如下所示为一条标准的db2diag.log日志条目:

2005-12-26-19.09.14.702039+480 I84831569A398 LEVEL: Severe PID : 060946 TID : 1
PROC : db2agent (XXXX) 0 INSTANCE: db2inst1 NODE : 000 DB :XXXX APPHDL :
0-222 APPID: C0A86402.OD11.03F806110349 FUNCTION: DB2 UDB, relation data serv,
sqlrr_fetch, probe:20 RETCODE : ZRC=0x80120086=-2146303866=SQLR_PRTCLE
"DRDA Protocol Error"
  
其中上面的黑体字部分是我们的每条诊断日志的不同列标识。其中FUNCTION包含:PRODUCT,COMPONENT,FUNCNAME,PROBE, 这几个也是可以单独搜索的列标志。
利用db2diag工具的-g选项可以对每一个列标志进行搜索,下面是-g选项的说明:
-g: 搜索符合搜索一系列“<列标志>=<列值>”条件的诊断日志记录,条件中间使用逗号分开。搜索区分大小写。 -gi: 功能等同于-g,搜索不区分大小写。 -gv: 搜索不符合一系列“<列标志>=<列值>”条件的诊断日志记录,条件中间使用逗号分开。搜索区分大小写。 -gvi:功能等同于-gv,搜索不区分大小写。
另外我们的条件表达式支持如下几种:
= 全字精确匹配查询 := 部分匹配模糊查询 != 查找不符合全字精确匹配查询条件的记录 !:= 查找不符合部分匹配模糊查询条件的记录 ^= 选择查找列中以后面的查找条件开头的记录 !^= 选择查找列中不以后面的查找条件开头的记录
关于高级查找功能的帮助,您可以随时通过"db2diag -h filter" 获得。
另外db2diag还对于特定的列标志提供了快捷选项,如LEVEL,可以使用-l选项指定,NODE可以使用-n选项指定。下面我们就以几个例子演示一下如何使用高级查找功能:
1、查找应用程序句柄APPHDL为0-222的所有诊断日志条目:

db2diag -g APPHDL="0-222"
  
2、查找应用程序句柄APPHDL为0-222在分区0上的所有诊断日志条目:

db2diag -g APPHDL="0-222",NODE=000
  
3、查找进程1060946的所有严重错误(Severe):

db2diag -g PID=1060946,LEVEL=Severe
  
4、查找所有FUNCTION名称中包饭fetch的诊断日志条目:

db2diag -g FUNCTION:=fetch
  
5、查找所有component名称以"base sys"开头的诊断日志条目:

db2diag -g "COMPONENT^=base sys"
  
6、查找所有返回码为"ZRC=0x80120086"的记录:

db2diag -g RETCODE:=0x80120086
  
除了过滤查找之外,db2diag还可以格式化输出。您可以指定查找结果的输出格式。关于格式化输出的详细帮助,请使用"db2diag -h fmt"命令查看。下面简单介绍一个例子:

db2diag -time 2005-12-22 -node "0,1,2" -level "Severe, Error" |db2diag -fmt "Time: %{ts} Partition: %node Message Level:%{level} \nPid: %{pid} Tid: %{tid} Instance:%{instance}\nMessage: @{msg}\n"
  
该命令将查找2005年12月22日以来在分区0,1,2上错误级别为Severe和Error的错误,并按照下面的格式输出:

Time: 2005-12-28-14.32.01.067843 Partition: 000 Message Level:Error Pid: 1871948 Tid: 1 Instance:db2inst1 Message: ZRC=0x860F000A=-2045837302=SQLO_FNEX "File not found." DIA8411C A file "" could not be found.

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-300342-1-1.html 上篇帖子: db2 9.7创建数据库 下篇帖子: 定时在线备份DB2数据库(Windows)
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表