设为首页 收藏本站
查看: 1873|回复: 0

[经验分享] kafka producer实例及原理分析

[复制链接]

尚未签到

发表于 2019-1-31 09:20:03 | 显示全部楼层 |阅读模式
  1.前言
  首先,描述下应用场景:

  假设,公司有一款游戏,需要做行为统计分析,数据的源头来自日志,由于用户行为非常多,导致日志量非常大。将日志数据插入数据库然后再进行分析,已经满足不了。最好的办法是存日志,然后通过对日志的分析,计算出有用的数据。我们采用kafka这种分布式日志系统来实现这一过程。
  步骤如下:


  •   搭建KAFKA系统运行环境
  

  如果你还没有搭建起来,可以参考我的博客:
  http://zhangfengzhe.blog.运维网.com/8855103/1556650
  


  •   设计数据存储格式
      

  


  • Producer端获取数据,并对数据按上述设计的格式进行编码





  • Producer将已经编码的数据发送到broker上,在broker上进行存储
      

  • Consumer端从broker中获取数据,分析计算。
  

  

  

  2.实现过程

  

  为了快速实现,我们简化日志消息格式。
  在eclipse新建JAVA PROJECT,将kafka/libs下*.jar配置到项目build path即可。
  

  Step 1 : 简单的POJO对象(MobileGameLog)
private String actionType;
private String appKey;
private String guid;
private String time;  

  说明:
  actionType 代表行为类型
  appKey     代表游戏ID
  guid       代表角色
  time       代表时间
  

  提供getter/setter方法,并override toString()
  

  

  Step 2 : 提供serializer
  

  需要注意的是,POJO对象需要序列化转化成KAFKA识别的消息存储格式--byte[]

  

  

public class MobileGameKafkaMessage implements kafka.serializer.Encoder{
@Override
public byte[] toBytes(MobileGameLog mobileGameLog) {
return mobileGameLog.toString().getBytes();
}
public MobileGameKafkaMessage(VerifiableProperties props){
}
}  

  

  

  Step 3 : 提供Partitioner
  

  我们可以提供Partitioner,这样可以使得数据按照我们的策略来存储在brokers中。
  


  这里,我根据appKey来进行分区。
  

  

  Step 4 : 提供Producer
  

[table][tr][td=1,1,747]  


  •   提供配置
  


  


  •   运行kafka环境
  
启动zookeeper:
[root@localhost kafka_2.9.2-0.8.1.1]# bin/zookeeper-server-start.sh  
config/zookeeper.properties &  

  启动kafka broker(id=0):
[root@localhost kafka_2.9.2-0.8.1.1]# bin/kafka-server-start.sh
config/server.properties &  

  启动kafka broker(id=1)
[root@localhost kafka_2.9.2-0.8.1.1]# bin/kafka-server-start.sh  
config/server-1.properties &  

  上述过程,在我的博客【搭建kafka运行环境】里面都有详细记录,大家可以参考。
  

  

  创建一个topic:
[root@localhost kafka_2.9.2-0.8.1.1]# bin/kafka-topics.sh --zookeeper localhost:2181
--create --topic log_1 --replication-factor 2 --partitions 3  注意topic:log_1有3个分区,2个复制。
  

  

  


  •   制造数据并发送
  

// Producer
// V: type of the message
// K: type of the optional key associated with the message
kafka.javaapi.producer.Producer producer
= new Producer(
config);
List list
= new ArrayList();
// 5条tlbb数据
for (int i = 1; i

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-669876-1-1.html 上篇帖子: Flink kafka 定制技巧 下篇帖子: Kafka 消费迟滞监控工具 Burrow
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表