设为首页 收藏本站
查看: 961|回复: 0

[经验分享] Hadoop调试源代码

[复制链接]

尚未签到

发表于 2018-10-30 11:15:19 | 显示全部楼层 |阅读模式
  本节介绍两种调试Hadoop源代码的方法:利用Eclipse远程调试工具和打印调试日志。这两种方法均可以调试伪分布式工作模式和完全分布式工作模式下的Hadoop。本节主要介绍伪分布式工作模式下的Hadoop调试方法。
  (1)利用Eclipse进行远程调试
  下面以调试ResourceManager为例,介绍利用Eclipse远程调试的基本方法,这可分两步进行。
  步骤1 调试模式下启动Hadoop。
  在Hadoop安装目录下运行如下的Shell脚本:
  export YARN_NODEMANAGER_OPTS="-Xdebug -Xrunjdwp:transport=dt_socket,address=8788, server=y,suspend=y"
  sbin/start-all.sh
  运行了脚本后会看到Shell命令行终端显示如下信息:
  Listening for transport dt_socket at address: 8788
  此时表明ResourceManager处于监听状态,直到收到debug确认信息。
  步骤2 设置断点。
  在前面新建的Java工程“hadoop-2.0”中,找到ResourceManager相关代码,并在感兴趣的地方设置一些断点。
  步骤3 在Eclipse中调试Hadoop程序。
  在Eclipse的菜单栏中,依次选择 “Run”→“Debug Configurations”→“Remote Java Applications”,并按照要求填写远程调试器名称(自己定义一个即可),ResourceManager所在host以及监听端口号等信息,并选择Hadoop源代码工程,便可进入调试模式。
  调试过程中,ResourceManager输出的信息被存储到日志文件夹下的yarn-XXX-resourcemanager-localhost.log文件(XXX为当前用户名)中,可通过以下命令查看调试过程中打印的日志:
  tail -f logs/yarn-XXX-resourcemanager-localhost.log
  (2)打印Hadoop调试日志
  Hadoop使用了Apache log4j作为基本日志库,该日志库将日志分别5个级别,分别为DEBUG、INFO、WARN、ERROR和FATAL。这5个级别是有顺序的,即DEBUG < INFO < WARN < ERROR < FATAL,分别用来指定日志信息的重要程度。日志输出规则为:只输出级别不低于设定级别的日志信息,比如若级别设定为INFO,则INFO、WARN、ERROR和FATAL级别的日志信息都会输出,但级别比INFO低的DEBUG则不会输出。
  在Hadoop源代码中,大部分Java文件中存在调试日志(DEBUG级别日志),但默认情况下,日志级别是INFO,为了查看更详细的运行状态,可采用以下几种方法打开DEBUG日志。
  方法1 使用Hadoop Shell命令。
  可使用Hadoop脚本中的daemonlog命令查看和修改某个类的日志级别,比如,可通过以下命令查看NodeManager类的日志级别:
  bin/hadoop daemonlog -getlevel ${nodemanager-host}:8042 \
  org.apache.hadoop.yarn.server.nodemanager.NodeManager
  可通过以下命令将NodeManager类的日志级别修改为DEBUG:
  bin/hadoop daemonlog -setlevel ${nodemanager-host}:8042 \
  org.apache.hadoop.yarn.server.nodemanager.NodeManager DEBUG
  其中,nodemanager-host为NodeManager服务所在的host,8042是NodeManager的HTTP端口号。
  方法2 通过Web界面。
  用户可以通过Web界面查看和修改某个类的日志级别,比如,可通过以下URL修改NodeManager类的日志级别:
  http://${nodemanager-host}:8042/logLevel
  方法3 修改log4j.properties文件。
  以上两种方式只能暂时修改日志级别,当Hadoop重启后会被重置,如果要永久性改变日志级别,可在目标节点配置目录下的log4j.properties文件中添加以下配置选项:
  log4j.logger.org.apache.hadoop.yarn.server.nodemanager.NodeManager=DEBUG
  此外,有时为了专门调试某个Java文件,需要把该文件的相关日志输出到一个单独文件中,可在log4j.properties中添加以下内容:
  #定义输出方式为自定义的TTOUT
  log4j.logger. org.apache.hadoop.yarn.server.nodemanager.NodeManager=DEBUG,TTOUT
  #设置TTOUT的输出方式为输出到文件
  log4j.appender.TTOUT =org.apache.log4j.FileAppender
  #设置文件路径
  log4j.appender.TTOUT.File=${hadoop.log.dir}/NodeManager.log
  #设置文件的布局
  log4j.appender.TTOUT.layout=org.apache.log4j.PatternLayout
  #设置文件的格式
  log4j.appender.TTOUT.layout.ConversionPattern=%d{ISO8601} %p %c: %m%n
  这些配置选项会把NodeManager.java中的DEBUG日志写到日志目录下的NodeManager.log文件中。
  在阅读源代码的过程中,为了跟踪某个变量值的变化,读者可能需要自己添加一些DEBUG日志。在Hadoop源代码中,大部分类会定义一个日志打印对象,通过该对象可打印各个级别的日志。比如,在NodeManager中用以下代码定义对象LOG:
  public static final Log LOG = LogFactory.getLog(NodeManager.class);
  用户可使用LOG对象打印调试日志。比如,可在NodeManager的main函数首行添加以下代码:
  LOG.debug("Start to lauch NodeManager...");
  然后重新编译Hadoop源代码,并将org.apache.hadoop.yarn.server.nodemanager.NodeManager的调试级别修改为DEBUG,重新启动Hadoop后便可以看到该调试信息。


运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-628412-1-1.html 上篇帖子: Hadoop应用引用第三方jar的几种方式(二) 下篇帖子: h1.1 hadoop简介
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表