设为首页 收藏本站
查看: 1701|回复: 0

[经验分享] 第二篇:Hadoop 在Ubuntu Kylin系统上的搭建[图解]

[复制链接]

尚未签到

发表于 2017-12-18 15:14:24 | 显示全部楼层 |阅读模式
前言
  本文介绍如何在Ubuntu Kylin操作系统上搭建Hadoop平台。

配置
  1. 操作系统: Ubuntu Kylin 14.04
  2. 编程语言: JDK 1.8
  3. 通信协议: SSH
  4. 云计算项目版本: Hadoop 1.2.1

第一步:安装最新版本的JDK (若已经安装过请忽略这一步)
  1. 去官网下载JDK1.8并解压 (当前安装包为:jdk-8u25-linux-x64.gz)
  2. 将解压后的安装包复制到 /usr/lib/jvm 目录下 (jvm目录需要自行创建)
  3. 以管理员方式打开 /etc/profile 文件并在文件底部添加以下代码:
  

1 #set Java Environment  

2 export JAVA_HOME=/usr/lib/jvm/jdk1.8.0_25  

3 export>
4 export PATH="$JAVA_HOME/bin:$PATH"  

  4. 执行以下命令使配置文件立即生效:
  

1 source /etc/profile  

  5. 执行以下命令验证JDK是否安装成功:
  

1 java -version  

  若显示以下信息表示安装完成:
DSC0000.png


第二步:配置SSH免密码登陆
  1. 执行以下命令安装SSH:
  

1 sudo app-get install ssh  

  2. 检查用户目录下是不是有个名为.ssh的隐藏文件夹,没有的话就自己创建一个。
  3. 执行以下命令配置SSH无密码登陆 (这几行代码的功能请参考SSH使用文档):
  

1 ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa  

2 cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys  

  4. 执行以下命令验证SSH是否安装配置成功:
  

1 ssh localhost  

  出现提示输入yes,若终端显示以下信息,表示SSH配置成功:
DSC0001.png


第三步:安装并运行Hadoop
  说明:Hadoop有三种运行方式 - 单机模式,伪分布式和完全分布式。
  其中,前两者主要用于程序的测试和调试,这里要讲的是伪分布式的配置,配置完全分布式的方法将在以后讲解。
  1. 下载并解压最新版本的Hadoop到当前目录下 (当前安装包为:hadoop-1.2.1.tar.gz)
  2. 进入conf子目录中,修改如下配置文件:
  a. hadoop-env.sh (设置JAVA路径)
  在末尾添加:
  

1 export JAVA_HOME=/usr/lib/jvm/jdk1.8.0_25  

  b. core-site.xml (配置HDFS地址及端口号)
  配置为:
  

<?xml version="1.0"?>  
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
  

  
<!-- Put site-specific property overrides in this file. -->
  

  
<configuration>
  
<property>
  
<name>fs.default.name</name>
  
<value>hdfs://localhost:9000</value>
  
</property>
  
</configuration>
  

  c. hdfs-site.xml (修改备份方式,单机版本需要将其改为1)
  配置为:
  

1 <?xml version="1.0"?>  
2 <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
  
3
  
4 <!-- Put site-specific property overrides in this file. -->
  
5
  
6 <configuration>
  
7         <property>
  
8                 <name>dfs.replication</name>
  
9                 <value>1</value>
  
10         </property>
  
11 </configuration>
  

  d. mapred-site.xml (设置JobTracker地址及端口)
  配置为:
  

1 <?xml version="1.0"?>  
2 <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
  
3
  
4 <!-- Put site-specific property overrides in this file. -->
  
5
  
6 <configuration>
  
7         <property>
  
8                 <name>mapred.job.tracker</name>
  
9                 <value>localhost:9001</value>
  
10         </property>
  
11 </configuration>
  

  3. 进入Hadoop文件夹执行以下命令以格式化Hadoop文件系统HDFS:
  

1 bin/hadoop namenode -format  

  4. 执行以下命令以启动所有Hadoop进程:
  

1 bin/start-all.sh  

  5. 验证Hadoop是否安装成功
  a. 打开浏览器,输入网址 http://localhost:50030 以查看MapReduce的Web页面:
DSC0002.png

  b. 打开浏览器,输入网址 http://localhost:50070 以查看HDFS的Web页面:

  如果显示正常,那么Hadoop环境便搭建好了。

小结
  1. 伪分布式的架构,机制和真实分布式其实是一样的,不过伪分布式中,Master和Slave都是一台机器。
  2. 关于真实分布式环境的搭建,将在以后介绍。到时会在虚拟机上组建一个虚拟网络,跑真·分布式程序。

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-425426-1-1.html 上篇帖子: Hadoop MapReduce编程 API入门系列之wordcount版本3(七) 下篇帖子: 解决:Permission denied at org.apache.hadoop.hive.ql.session.SessionState.start(Se
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表