设为首页 收藏本站
查看: 1012|回复: 0

[经验分享] 【转载】Hadoop 2.7.3 和Hbase 1.2.4安装教程

[复制链接]

尚未签到

发表于 2017-12-17 21:26:04 | 显示全部楼层 |阅读模式
一、机器环境


  • 系统:MAC OS
  • Hadoop:2.7.3
  • Hbase:1.2.4
  • JDK: 1.8.0_112
二、配置SSH免密码登录
  第一步:打开terminal,进入根目录,运行命令:
  

            cd  

  第二步: 显示隐藏文件,这时还没有.ssh文件夹
  

        ls –a  

  第三步:生成密钥
  

    ssh-keygen -t rsa -P ""  

DSC0000.jpg

  第四步,进入.ssh文件夹,运行:
  

cat>  

  第五步: ssh登录
  

ssh localhost  

DSC0001.jpg


三、安装Hadoop 2.7.3

3.1下载Hadoop
  Hadoop下载地址:http://hadoop.apache.org/releases.html
  下载hadoop-2.7.3.tar.gz,大约204MB。
  下载后解压缩:
  

sudo tar –zxvf hadoop-2.7.3.tar.gz  

  Hadoop有三种安装模式:单机模式、伪分布式模式、分布式模式。

3.2运行Hadoop单机模式
  解压安装文件之后,就是单机模式,运行wordcount测试是否安装成功。
  第一步:在hadoop-2.7.3目录下新建input文件夹。
  

sudo mkdir input  

  第二步:在input文件夹下新增2个文本文件用于测试。
  

echo 'hello world' > file1.txt  
echo 'hello hadoop' > file2.txt
  

  第三步:运行wordcount例子
  

sudo ./bin/hadoop jar ./share/hadoop/mapreduce/hadoop-  
mapreduce-examples-2.7.3.jar wordcount input/ output
  

DSC0002.jpg

  No news is good news,没waring、没error就说明正确运行。
  第四步:查看运行结果:
  

cat output/part-r-00000  

  统计结果:
  

hadoop  1  
hello   2
  
world   1
  

DSC0003.jpg


3.3 Hadoop伪分布式模式

3.3.1修改hadoop-env.sh
  

文件位置: hadoop-2.7.3/etc/hadoop/hadoop-env.sh  

  
注释掉 HADOOP_OPTS
  

  

#export HADOOP_OPTS="$HADOOP_OPTS -Djava.net.preferIPv4Stack=true"  

  改为:
  

export HADOOP_OPTS="$HADOOP_OPTS -Djava.net.preferIPv4Stack=true -Djava.security.krb5.realm= -Djava.security.krb5.kdc="  

3.3.2修改core-site.xml
  文件位置: hadoop-2.7.3/etc/hadoop/core-site.xml
  修改为如下配置:
  

<configuration>  
<property>
  
<name>hadoop.tmp.dir</name>
  
<value>/usr/local/Cellar/hadoop-2.7.3/hdfs/tmp</value>
  
<description>A base for other temporary directories</description>
  
</property>
  
<property>
  
<name>fs.default.name</name>
  
<value>hdfs://localhost:9000</value>
  
</property>
  
</configuration>
  

  其中/Users/bee/Documents/bd/hadoop-2.7.3/hdfs/tmp可以自定义. fs.default.name 保存了NameNode的位置,HDFS和MapReduce组件都需要用到它,这就是它出现在core-site.xml 文件中而不是 hdfs-site.xml文件中的原因。

3.3.3修改mapred-site.xml.template
  

<configuration>  
<property>
  
<name>mapred.job.tracker</name>
  
<value>localhost:9010</value>
  
</property>
  
</configuration>
  

  变量mapred.job.tracker 保存了JobTracker的位置,因为只有MapReduce组件需要知道这个位置,所以它出现在mapred-site.xml文件中。

3.3.4修改hdfs-site.xml
  

变量dfs.replication指定了每个HDFS数据库的复制次数。 通常为3, 由于我们只有一台主机和一个伪分布式模式的DataNode,将此值修改为1。  

  

<configuration>  
<property>
  
<name>dfs.replication</name>
  
<value>1</value>
  
</property>
  
</configuration>
  


3.4启动hadoop

3.4.1格式化hdfs
  

./bin/hadoop namenode -format  

DSC0004.jpg


3.4.2启动Hadoop
  运行启动命令:
  

./sbin/start-all.sh  

  查看进程:
  

jps  

  启动成功之后可以看到NodeManager、NameNode、SecondaryNameNode、ResourceManager这几个进程。
  

2338 NodeManager  
2389 Jps
  
1900 NameNode
  
2108 SecondaryNameNode
  
2238 ResourceManager
  

DSC0005.jpg

  访问HDFS的web端口: http://localhost:50070
DSC0006.jpg


四、安装Hbase 1.2.4

4.1 Hbase下载
  http://hbase.apache.org/
  下载后解压缩。

4.2 单机运行
  查看Hbase版本:
  

./bin/hbase version  

DSC0007.jpg

  启动Hbase:
  

./bin/start-hbase.sh  

DSC0008.jpg

  进入Hbase shell:
  

./bin/hbase shell  



4.3伪分布式运行

4.3.1 第一步:修改hbase-env.sh
  

文件位置: hbase-1.2.4/conf/hbase-env.sh  
开启HBASE_MANAGES_ZK,改值默认是注释的,作用是:使用自带的ZooKeeper。我们为了方便,使用Hbase自带的ZooKeeper:
  

  

    export HBASE_MANAGES_ZK=true  

4.3.2 第二步:修改hbase-site.xml
  

<property>  
<name>hbase.rootdir</name>
  
<value>hdfs://localhost:9000/hbase</value>
  
</property>
  
<property>
  
<name>hbase.cluster.distributed</name>
  
<value>true</value>
  
</property>
  


4.3.3启动Hbase
  启动之前,先启动hadoop:
  

    ./sbin/start-all.sh  

  再启动hbase:
  

  ./bin/start-hbase.sh  

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-425167-1-1.html 上篇帖子: 马士兵hadoop第二课:hdfs集群集中管理和hadoop文件操作 下篇帖子: hadoop多硬盘配置注意点
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表