hadoop的5个进程解释

winson 发表于 2018-10-30 11:32:49

hadoop的五个守护进程
　　一般如果正常启动hadoop，我们可以在master上通过jps命令看到以下5个daemons:
　　# jps
　　19803 SecondaryNameNode
　　19994 TaskTracker
　　31144 Jps
　　19571 NameNode
　　19672 DataNode
　　19887 JobTracker
　　下面依次介绍这些进程：
　　1. NameNode
　　它是Hadoop 中的主服务器，管理文件系统名称空间和对集群中存储的文件的访问。
　　参考资料：
　　http://www.linuxidc.com/Linux/2012-01/51614.htm
　　2. SecondaryNameNode
　　它不是 namenode 的冗余守护进程，而是提供周期检查点和清理任务。
　　出于对可扩展性和容错性等考虑，我们一般将SecondaryNameNode运行在一台非NameNode的机器上。
　　参考资料：
　　http://www.linuxidc.com/Linux/2012-01/51628.htm
　　http://www.linuxidc.com/Linux/2012-01/51622.htm
　　3. DataNode
　　它负责管理连接到节点的存储（一个集群中可以有多个节点）。每个存储数据的节点运行一个 datanode 守护进程。
　　4. JobTracker和TaskTracker
　　JobTracker负责调度 DataNode上的工作。每个 DataNode有一个TaskTracker，它们执行实际工作。
　　JobTracker和 TaskTracker采用主-从形式，JobTracker跨DataNode分发工作，而 TaskTracker执行任务。
　　JobTracker还检查请求的工作，如果一个 DataNode由于某种原因失败，JobTracker会重新调度以前的任务。

页: [1]

运维网's Archiver

hadoop的5个进程解释