设为首页 收藏本站
查看: 1171|回复: 0

[经验分享] Hadoop学习总结(1)-入门篇|伪分布式安装

[复制链接]

尚未签到

发表于 2018-10-31 09:58:59 | 显示全部楼层 |阅读模式
Hadoop是什么?
  适合大数据的分布式存储于计算平台
  不适用小规模数据
  作者:Doug Cutting
  受Google三篇论文的启发
Hadoop核心项目
  HDFS(Hadoop Distrubuted File System) 分布式文件系统
  MapReduce 并行计算框架
版本
  Apache
  官方版本
  Cloudera
  使用下载最多的版本,稳定,有商业支持,在Apache的基础上打上了一些补丁(Patch)。推荐使用。
  
  Yahoo
  Yahoo内部使用的版本,发不过两次,已有的版本放到Apache上,后续不在继承发布,而是继承在Apache的版本上。
  Intel、IBM、微软等等。。。
HDFS架构
  主从结构
  主节点,只有一个namenode
  从节点,有很多歌datanode
  namenode负责:
  接收用户操作的请求
  维护文件系统的目录结构
  管理文件与block之间关系,block与datanode的关系
  datanode负责:
  存储文件
  文件被分成block存储在磁盘上
  为了保证数据安全,文件会有多个副本
MapReduce架构
  主从结构
  主节点:只有一个JobTracker
  从节点:有很多歌TaskTrackers
  JobTracker负责
  接收客户提交的计算任务
  把计算任务分给TaskTrackers执行
  监控TaskTrackers的执行情况
  TaskTrackers负责
  执行JobTracker分配的计算任务
Hadoop的特点
  扩容能力,可以存储PB级别数据
  成本低,可以用普通组装服务器做集群
  高效率,可以分发数据并行处理
  可靠性,自动维护多个副本,任务使用可以自动部署计算任务
Hadoop集群的物理分布
DSC0000.png

单点结构图
DSC0001.png

Hadoop部署方式
  本地模式(不使用)
  伪分布模式(实验学习使用,模拟集群模式)
  集群模式(生产环境使用)
安装前软件准备
  虚拟机(VitualBox/Vmware/Xen)
  操作系统(Centos/RedHat..)
  Jdk
  Hadoop安装包
Hadoop伪分布安装步骤
  1、关闭防火墙
  chkconfig iptables off 关闭开机启动
  service iptables stop 关闭运行的防火墙
2、修改ip
  vi /etc/sysconfig/network-script/ifcfg-eth0
3、修改hostname
  vi /etc/sysconfig/network
  修改hostname
4、设置ssh密钥登陆
  ssh-keygen -t rsa
  cp ~/.ssh/id_rsa.pub ~/.ssh/authorized_keys
5、安装jdk
  chmod 755 jdk* 设置执行权限
  ./ jdk-6u24-linux-i586.bin 解压
  cp -rf jdk1.6.0_24/ /usr/local/jdk 拷贝目录指定目录,可以自己指定
  vi /etc/profile 设置环境变量
  添加export JAVA_HOME=/usr/local/jdk
  export PATH=.:$JAVA_HOME/bin:$PATH
  source /etc/profile 立即生效
  验证
  java –version
  出现以下内容表示成功
  java version "1.6.0_24"
  Java(TM) SE Runtime Environment (build 1.6.0_24-b07)
  Java HotSpot(TM) Client VM (build 19.1-b02, mixed mode)
6、安装hadoop
  解压
  tar -zxvf hadoop-1.1.2.tar.gz -C /usr/src/
  [root@h1 soft]# cd /usr/src/
  [root@h1 src]# cp -rf hadoop-1.1.2/ /usr/local/hadoop
修改环境变量
  vi /etc/profile
  添加
  export JAVA_HOME=/usr/local/jdk
  export HADOOP_HOME=/usr/local/hadoop
  export PATH=.:$HADOOP_HOME/bin:$JAVA_HOME/bin:$PATH
  source /etc/profile 立即生效
修改配置文件
  修改hadoop-env.sh
  添加jdk环境变量配置
  export JAVA_HOME=/usr/local/jdk
  修改core-site.xml
  
  设置默认名称和端口号
  
  fs.default.name
  hdfs://h1:9000
  
  设置临时目录存储位置,一般放在单独磁盘目录
  
  hadoop.tmp.dir
  /usr/local/hadoop/tmp
  
  
  修改hdfs-site.xml
  
  副本数量
  
  dfs.replication
  1
  
  关闭权限验证
  
  dfs.permissions
  false
  
  
  修改mapred-site.xml
  
  
  
  mapred.job.track
  h1:9001
  
  
  
格式化文件系统
  hadoop namenode -format
启动
  start-all.sh
  验证
  [root@h1 conf]# jps
  6366 TaskTracker
  5844 NameNode
  6466 Jps
  6135 SecondaryNameNode
  6223 JobTracker
  5989 DataNode
  http://h1:55070/访问namenode监控首页
  http://h1:50030/访问mapreduce监控首页


运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-628822-1-1.html 上篇帖子: Hadoop连载系列之一:Hadoop集群搭建 下篇帖子: hadoop面试题答案
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表