winson 发表于 2018-10-30 11:32:49

hadoop的5个进程解释

hadoop的五个守护进程      
  一般如果正常启动hadoop,我们可以在master上通过jps命令看到以下5个daemons:
  # jps
  19803 SecondaryNameNode
  19994 TaskTracker
  31144 Jps
  19571 NameNode
  19672 DataNode
  19887 JobTracker
  下面依次介绍这些进程:
  1. NameNode
  它是Hadoop 中的主服务器,管理文件系统名称空间和对集群中存储的文件的访问。
  参考资料:
  http://www.linuxidc.com/Linux/2012-01/51614.htm
  2. SecondaryNameNode
  它不是 namenode 的冗余守护进程,而是提供周期检查点和清理任务。
  出于对可扩展性和容错性等考虑,我们一般将SecondaryNameNode运行在一台非NameNode的机器上。
  参考资料:
  http://www.linuxidc.com/Linux/2012-01/51628.htm
  http://www.linuxidc.com/Linux/2012-01/51622.htm
  3. DataNode
  它负责管理连接到节点的存储(一个集群中可以有多个节点)。每个存储数据的节点运行一个 datanode 守护进程。
  4. JobTracker和TaskTracker
  JobTracker负责调度 DataNode上的工作。每个 DataNode有一个TaskTracker,它们执行实际工作。
  JobTracker和 TaskTracker采用主-从形式,JobTracker跨DataNode分发工作,而 TaskTracker执行任务。
  JobTracker还检查请求的工作,如果一个 DataNode由于某种原因失败,JobTracker会重新调度以前的任务。

页: [1]
查看完整版本: hadoop的5个进程解释