设为首页 收藏本站
查看: 1039|回复: 0

[经验分享] hadoop hbase 完全分布式

[复制链接]
累计签到:1 天
连续签到:1 天
发表于 2015-7-13 09:35:00 | 显示全部楼层 |阅读模式
  环境:
  三台机器,118做为Master,其他机器作为Slaver。
  hadoopMaster:192.168.61.118
centos1: 192.168.61.137
centos2:192.168.61.138
  0、准备工作
  在所有机器上修改机器名和Hosts文件
  1)修改主机名:



vi /etc/sysconfig/network
  添加一行记录,如



192.168.61.118 hadoopMaster
  2)修改hosts文件



vi /etc/hosts
  
每台机器都设置如下



192.168.61.118 hadoopMaster hadoopMaster
192.168.61.137 centos1
192.168.61.138 centos2
  
  重启所有机器。使配置生效。
  1、在所有的机器上安装Java
  (jdk 官网下载地址:http://www.oracle.com/technetwork/java/javase/downloads/jdk-6u30-download-1377139.html
我这里下载64位的: http://download.oracle.com/otn-pub/java/jdk/6u30-b12/jdk-6u30-linux-i586.bin)
  用root用户登录,



cd /usr
mkdir java
wget http://download.oracle.com/otn-pub/java/jdk/6u30-b12/jdk-6u30-linux-i586.bin
chmod a+x *.bin
./*.bin
  这样,java的安装路径就是在/usr/java/jdk1.6.0_30,然后可以先把第5步做了,确保javac,java,java -version正确。
  
  2、在所有的机器上建立相同的用户
  useradd wsy
  passwd wsy
  输入你要设置的密码
  
  以下操作步骤(3,4)以wsy帐户进行。
  3、SSH设置
  使用wsy用户登录,cd ~,在所有机器所有机器/home/wsy目录下,



mkdir .ssh
chmod 700 .ssh
  在namenode上生成密钥对



$ ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
$ cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys
  设置authorized_keys的权限如下:




cd .ssh
chmod 600 authorized_keys
  分发keys,



scp authorized_keys centos1:~/.ssh/
scp authorized_keys centos2:~/.ssh/
  这时从hadoopMaster向其他机器发起SSH连接,只有第一次登录时需要输入密码,以后则不需要。
  请确保完全这一步,才继续往下做!
  

  4、下载配置hadoop http://www.apache.org/dyn/closer.cgi/hadoop/common/
  在/home/wsy 目录下下载hadoop-0.20.2.tar.gz和hbase-0.90.4.tar.gz,
  解压hadoop



tar -zxvf hadoop-0.20.2.tar.gz
  hbase也同样解压。
  接下来是真正开始配置hadoop,cd 到 /home/wsy/hadoop-0.20.2/conf,vi hadoop-env.sh



# The java implementation to use.  Required.
export JAVA_HOME=/usr/java/jdk1.6.0_30
  找到如上代码,修改之。
修改core-site.xml





fs.default.name
hdfs://hadoopMaster:9000


hadoop.tmp.dir
/home/wsy/hadooptmp


  修改hdfs-site.xml
  
  






dfs.replication
1


dfs.datanode.max.xcievers
4096


dfs.replication表示备份数,可以修改为其他数字。

  修改mapred-site.xml





mapred.job.tracker
60.191.142.184:9001


  修改masters和slaves文件,
  master.xml:



192.168.61.118
  slaves.xml



192.168.61.137
192.168.61.138
  把在namenode上配置好的hadoop,分发到各机器。



scp -r hadoop-0.20.2 centos1:/home/wsy
scp -r hadoop-0.20.2 centos2:/home/wsy
  
  
  
  
5、设置系统环境变量
  用root帐号修改/etc/profile,在文件最后面加入如下环境变量



export JAVA_HOME=/usr/java/jdk1.6.0_30
export PATH=$JAVA_HOME/bin:$PATH
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export HADOOP_HOME=/home/wsy/hadoop-0.20.2
export PATH=$PATH:$HADOOP_HOME/bin
export HBASE_HOME=/home/wsy/hbase-0.90.4
export PATH=$PATH:$HBASE_HOME/bin
  source /etc/profile ,使配置生效。
HBASE那一行,目前还没有配置,提前配置着。
  
  6、启动hadoop
  注意点:关闭所有机器上的防火墙(正式环境中需要配置好相应的防火墙),不然会导致datanode起不来。



/etc/init.d/iptables stop
  在namenode端格式化分布式文件系统:



hadoop namenode -format
  
接着在namenode端启动hadoop进程:



start-all.sh
  

  使用jps命令查看。
  浏览器中浏览

http://hadoopMaster:50030
http://hadoopMaster:50070
  能正确显示。就ok了!
  

  7、配置hbase
  修改hbase-0.90.4/conf下hbase-env.sh,在文件尾添加:



export JAVA_HOME=/usr/java/jdk1.6.0_30
export HBASE_MANAGES_ZK=true
export HBASE_HOME=/home/wsy/hbase-0.90.4
export HADOOP_HOME=/home/wsy/hadoop-0.20.2
  
修改hbase-site.xml





    hbase.rootdir
    hdfs://hadoopMaster:9000/hbase


    hbase.cluster.distributed
    true


    hbase.master
    hadoopMaster:60000


    hbase.zookeeper.property.maxClientCnxns
    0


    hbase.zookeeper.quorum
    192.168.61.118,192.168.61.137,192.168.61.138


    注意quorum只能为奇数。
  
  修改hbase-0.90.4/conf/regionservers
  和hadoop的slaves保持一致。
  删除hbase-0.90.4/lib目录下的hadoop-core-0.20-append-r1056497.jar,再cp hadoop目录下的hadoop-0.20.2-core.jar到hbase-0.90.4/lib目录。
  将hbase-0.90.4分发到其他机器上



scp -r hbase-0.90.4 centos1:/home/wsy
scp -r hbase-0.90.4 centos2:/home/wsy
  

  启动hbase.



start-hbase.sh
  使用jps进行查看,在浏览器里输入
  http://hadoopMaster:60010/master.jsp
  http://hadoopMaster:60030/regionserver.jsp
  能打开管理界面就Ok!
  

  8、安装问题
  1)时间同步问题
  如果几台机器时间不一致,将导致某些节点启动不起来。
  1.方案1
在hbase-site.xml添加配置

        hbase.master.maxclockskew
        180000
        Time difference of regionserver from master

2.方案2
  错误里指出节点机的时间和master的时间差距大于30000ms,就是30秒时无法启动服务。
修改各结点时间,使其误差在30s内
  要配置服务器时间同步需要用到ntp,最好能连接外网的时间服务器。内网里面配起来比较麻烦点,所以就手动改了时间,再启动就可以了。

这个比较实用:
yum install ntp
安装后执行
ntpdate cn.pool.ntp.org
即可同步国际时间..
开机后自动同步时间:
vi /etc/rc.d/rc.local中,最下面添加
ntpdate cn.pool.ntp.org
  
参考资料:http://archive.iyunv.com/a/2272761/
  http://www.iyunv.com/flyoung2008/archive/2011/11/29/2268302.html
  

  伪分布式,就是缺少一个分发过程,在配置hbase-site.xml是没有hbase.zookeeper.quorum属性
  
  
下面记录一些其他的玩意,和本次主题无关。
  9、应用架构
在 /usr/local 下面新建文件夹 software
  以后把所有与应用相关的安装文件都放在了这里。
  software目录下内容可能如下(目前为空):



drwxr-xr-x 7 root root    4096 Jan 12 05:30 apache-solr-3.5.0
-rw-r--r-- 1 root root 6908320 Jan 12 06:15 apache-tomcat-6.0.30.zip
drwxrwxrwx 3 root root    4096 Jan 12 08:14 IKAnlyzer
drwxr-xr-x 9 root root    4096 Jan 12 08:40 tomcat-solr
drwxr-xr-x 9 root root    4096 Jan 12 21:42 tomcat-solr-bak
drwxrwxrwx 9 root root    4096 Jan 17  2011 tomcat-weibo
drwxr-xr-x 9 root root    4096 Jan 12 21:42 tomcat-weibo-bak
  


apache-solr-3.5.0是下载的文件,tomcat-solr为solr的应用服务。tomcat-weibo下面为自己写的应用。
  

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-86118-1-1.html 上篇帖子: hadoop集群配置-2问题汇总 下篇帖子: HBase的领导人探讨Hadoop、BigTable和分布式数据库
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表