设为首页 收藏本站
查看: 1462|回复: 0

[经验分享] Flume-0.9.4分布式安装与配置手册

[复制链接]

尚未签到

发表于 2015-11-27 18:27:10 | 显示全部楼层 |阅读模式
  From:  http://www.iteblog.com/archives/911

  个人在运行过程中遇到的问题解决方案是:
  
  As people in cloudera mail list suggest, there are probable reasons of this error:

  • The HDFS safemode is turned on. Try to run hadoop fs -safemode leave and see if the error goes away.
  • Flume and Hadoop versions are mismatched. To check this replace the hadoop-core.jar in flume/lib directory with the one found in hadoop's installation folder.

  Flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(比如文本、HDFS、Hbase等)的能力。
  Flume主要有以下几类组件:
  (1)、Master: 负责配置及通信管理,是集群的控制器,并支持多master节点;
  (2)、Agent: 采集数据,Agent是flume中产生数据流的地方,同时Agent会将产生的数据流传输到Collector;
  (3)、Collector: 用于对数据进行聚合(数据收集器),往往会产生一个更大的数据流,然后加载到storage(存储)中 。
  简单地来说,就是Agent把采集到的数据定时发送给Collector,Collector接收Agent发送的数据并把数据写到指定的位置(比如文本、HDFS、Hbase等)。
  这篇文章主要简单介绍如何部署Flume-0.9.4分布式环境,涉及到三台机器。它们的hostname分别为master,agent,collector。
  1、到官网下载Flume-0.9.4,并解压:  
1[wyp@master~]$ wget https://repository.cloudera.com/content/                  \2      repositories/releases/com/cloudera/flume-distribution/0.9.4-cdh4.0.0/   \3       flume-distribution-0.9.4-cdh4.0.0-bin.tar.gz                           \4[wyp@master~]$  tar -zxvf flume-distribution-0.9.4-cdh4.0.0-bin.tar.gz5[wyp@master~]$ cd flume-0.9.4-cdh3u36[wyp@masterflume-0.9.4-cdh3u3]$  2、进入$FLUME_HOMNE/bin目录,将flume-env.sh.template重命名为flume-env.sh,并在flume-env.sh文件里面设置如下变量:
1[wyp@masterflume-0.9.4-cdh3u3]$ cd bin2[wyp@masterbin]$ cp flume-env.sh.template flume-env.sh3[wyp@masterbin]$ vim flume-env.sh4 5export FLUME_HOME=/home/q/flume-0.9.4-cdh3u36export FLUME_CONF_DIR=$FLUME_HOME/conf7export PATH=$PATH:$FLUME_HOME/bin8export JAVA_HOME=/usr/lib/jvm/java-6-sun  3、进入$FLUME_HOMNE/conf目录,将flume-site.xml.template重命名为flume-site.xml,并修改flume-site.xml配置文件
查看源代码打印帮助01[wyp@masterbin]$ cd ../conf02[wyp@masterconf]$ cp flume-site.xml.template flume-site.xml03[wyp@masterconf]$ vim flume-site.xml04<property>05    <name>flume.master.servers</name>06    <value>master</value>07    <description>This is the addressforthe config servers status08    server (http)09    </description>10</property>11 12<property>13    <name>flume.collector.output.format</name>14    <value>raw</value>15    <description>The output formatforthe data written by a Flume16    collector node.  There are several formats available:17      syslog - outputs events in a syslog-like format18      log4j - outputs events in a pattern similar to Hadoop's log4j pattern19      raw - Event body only.  This is most similar to copying a file but20        does not preserve any uniqifying metadata like host/timestamp/nanos.21      avro - Avro Native file format.  Default currently is uncompressed.22      avrojson -thisoutputs data as json encoded by avro23      avrodata -thisoutputs data as a avro binary encoded data24      debug - used onlyfordebugging25    </description>26  </property>27 28 <property>29    <name>flume.collector.roll.millis</name>30    <value>300000</value>31    <description>The time (in milliseconds)32    between when hdfs files are closed and anewfile is opened33    (rolled).34    </description>35  </property>36 37<property>38    <name>flume.agent.logdir.maxage</name>39    <value>10000</value>40    <description> number of milliseconds before a local log file is41    considered closed and ready to forward.42    </description>43  </property>44 45  <property>46    <name>flume.agent.logdir.retransmit</name>47    <value>60000</value>48    <description>The time (in milliseconds) before a sent event is49    assumed lost and needs to be retried in end-to-end reliability50    mode again.  This should be at least 2x the51    flume.collector.roll.millis.52    </description>53  </property>  4、将配置好的Flume整个文件夹打包,并发送到agent和collector的机器上:
1[wyp@master~]$ tar -zcvf flume-0.9.4-cdh3u3.tar.gz flume-0.9.4-cdh3u32[wyp@master~]$ scp flume-0.9.4-cdh3u3.tar.gz agent:/home/wyp3[wyp@master~]$ scp flume-0.9.4-cdh3u3.tar.gz collector:/home/wyp  5、分别在agent和collector机器上解压上述包,并在master,agent和collector机器上分别启动以下进程:
1[wyp@master~]$ $FLUME_HOME/bin/flume master2 3[wyp@agent~]$ $FLUME_HOME/bin/flume node_nowatch –n agent4 5[wyp@collector~]$ $FLUME_HOME/bin/flume node_nowatch –n collector这样master机器就充当master角色;agent 机器充当agent角色;collector机器充当collector角色。
  6、打开http://master:35871,看看能否进去,并看到agent和collector进程成功启动,则说明Flume安装完成!

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-144315-1-1.html 上篇帖子: flume插件开发 下篇帖子: 分布式海量日志采集、聚合和传输系统:Cloudera Flume
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表