Hadoop + HBase + Hive 完全分布式部署笔记

o_哈哈o · 发表于 2015-7-12 11:51:05

　　上次记录了伪分布式部署，今天记录完全分布式Hadoop + HBase + Hive 部署过程的的一些问题。
　　NameNode: 192.168.229.132
　　DataNode: 192.168.229.133/192.168.229.134
　　
　　--------------------------------------------------------------------------------
　　配置 Hadoop
　　无密码SSH
　　首先是NameNode需要通过ssh来访问DataNode，配置一个无密码的ssh
　　NameNode上生成公钥私钥
　　$ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
　　把公钥放到tmp目录，并且scp到每一个DataNode
　　$cp ~/.ssh/id_dsa.pub /tmp
　　在NameNode和DataNode都执行这个，完成配置
　　$cat /tmp/id_dsa.pub >> ~/.ssh/authorized_keys
　　
　　配置文件 (其中涉及到的目录会自动创建)
　　conf/hadoop-env.sh
　　# The java implementation to use.  Required.
export JAVA_HOME=/usr/jdk1.6.0_25
　　
　　conf/core-site.xml  (如果要使用HIVE，就需要把红色的IP改成主机名，否则会有Wrong FS错误)
　　


fs.default.name
hdfs://192.168.229.132:9000



hadoop.logfile.size
10

　　
　　conf/hdfs-site.xml
　　


dfs.name.dir
/u01/app/data/dfs.name.dir



dfs.data.dir
/u01/app/data/dfs.data.dir


　　
　　conf/mapred-site.xml
　　


mapred.job.tracker
192.168.229.132:9001



mapred.system.dir
/u01/app/data/mapred.system.dir



mapred.local.dir
/u01/app/data/mapred.local.dir


　　
　　主从配置
　　conf/masters
　　192.168.229.132
　　conf/slaves
　　192.168.229.133
　　192.168.229.134
　　
　　在NameNode进行了所有的配置之后，通过scp把hadoop安装目录同步到DataNode。然后在NameNode进行格式化和启动。
　　
　　--------------------------------------------------------------------------------
　　配置 HBase
　　$vi /etc/hosts （HBase使用机器名称，在hosts里面必须配置集群里面的机器）
127.0.0.1 localhost
192.168.229.132 ubuntu02
192.168.229.133 ubuntu03
192.168.229.134 ubuntu04
　　
　　conf/hbase-env.sh (这里)
　　# The java implementation to use.  Java 1.6 required.
export JAVA_HOME=/usr/jdk1.6.0_25
　　# Extra Java CLASSPATH elements.  Optional.
export HBASE_CLASSPATH=/u01/app/hadoop/conf
　　# Tell HBase whether it should manage it's own instance of Zookeeper or not.
export HBASE_MANAGES_ZK=true
　　
　　conf/hbase-site.xml (红色部分必须使用主机名称，其他部分可以使用IP)
　　

hbase.rootdir
hdfs://ubuntu02:9000/u01/app/data/hbase


hbase.cluster.distributed
true


hbase.master
hdfs://192.168.229.132:60000


hbase.zookeeper.quorum
192.168.229.132, 192.168.229.133, 192.168.229.134


　　
　　conf/regionservers （和Hadoop的slaves文件一致）
192.168.229.133
192.168.229.134
　　
　　通过scp把hbase安装目录同步到DataNode
　　
　　----------------------------------------------------------------------------------------------
　　配置 Hive
　　
　　MySQL存储元数据 （安装过程见这里）
　　创建数据库的时候，必须使用latin1作为字符集，否则会有错误信息Specified key was too long; max key length is 767 bytes
　　mysql> create database hivedb default character set latin1;
mysql> create user 'hive'@'localhost' identified by 'hive';
mysql> grant all on hivedb.* to 'hive'@'localhost';
　　
　　Hive 配置信息（Hive仅需要在Master节点安装配置即可）
　　bin/hive-config.sh （可以设置 .profile 文件来略过这步）
export JAVA_HOME=/usr/jdk1.6.0_25
export HIVE_HOME=/u01/app/hive
export HADOOP_HOME=/u01/app/hadoop
　　
　　conf/hive-site.xml

  javax.jdo.option.ConnectionURL
  jdbc:mysql://localhost:3306/hivedb?createDatabaseIfNotExist=true
  JDBC connect string FOR a JDBC metastore


  javax.jdo.option.ConnectionDriverName
  com.mysql.jdbc.Driver
  Driver class name FOR a JDBC metastore

  javax.jdo.option.ConnectionUserName
  hive
  username TOUSE against metastore database


  javax.jdo.option.ConnectionPassword
  hive
  password TOUSE against metastore database

　　
　　MySQL 驱动包
　　下载mysql-connector-java-5.1.18-bin.jar文件，并放到$HIVE_HOME/lib目录下
　　
　　测试
　　hadoop@ubuntu02:/u01/app/hive$ bin/hive
Logging initialized using configuration in jar:file:/u01/app/hive-0.8.1-bin/lib/hive-common-0.8.1.jar!/hive-log4j.properties
Hive history file=/tmp/hadoop/hive_job_log_hadoop_201203201733_2122821776.txt
hive> show tables;
OK
tb
Time taken: 2.458 seconds
hive>
　　
　　-----------------------------------------------------------------------------------------------
　　PS：安装的过程中遇到一些小问题，解决方法在这里

账号		自动登录	找回密码
密码			立即注册

Centos6.5×64安装配置openmeetings3.0.3详

大疆运维招人啦，

C++ :try 语句块和异常处理

C++的多态

Red Hat RHCE 8 (EX294) Cert Guide

Java/C++ 区别：看完这一篇，就够用！

别再用过时库了！这 13 个顶级 C++ 库才是

[经验分享] Hadoop + HBase + Hive 完全分布式部署笔记

浏览过的版块

扫码加入运维网微信交流群