设为首页 收藏本站
查看: 1066|回复: 0

[经验分享] Hadoop storm大数据分析 知识体系结构

[复制链接]

尚未签到

发表于 2015-7-12 08:02:20 | 显示全部楼层 |阅读模式
  最近工作工作有用到hadoop 和storm,最近看到一个网站上例句的hadoop 和storm的知识体系。所以列出来供大家了解和学习。来自哪个网站就不写了以免以为我做广告额。
  目录结构知识点还是挺全的,可以按照点学习。
一、Hadoop入门,了解什么是Hadoop二、分布式文件系统HDFS,是数据库管理员的基础课程
  1、Hadoop产生背景
  2、Hadoop在大数据、云计算中的位置和关系
  3、国内外Hadoop应用案例介绍
  4、国内Hadoop的就业情况分析及课程大纲介绍
  5、分布式系统概述
  6、Hadoop生态圈以及各组成部分的简介
  7、Hadoop核心MapReduce例子说明
  1、分布式文件系统HDFS简介
  2、HDFS的系统组成介绍
  3、HDFS的组成部分详解
  4、副本存放策略及路由规则
  5、NameNode Federation
  6、命令行接口
  7、Java接口
  8、客户端与HDFS的数据流讲解
  9、HDFS的可用性(HA)
三、初级MapReduce,成为Hadoop开发人员的基础课程四、高级MapReduce,高级Hadoop开发人员的关键课程
  1、如何理解map、reduce计算模型
  2、剖析伪分布式下MapReduce作业的执行过程
  3、Yarn模型
  4、序列化
  5、MapReduce的类型与格式
  6、MapReduce开发环境搭建
  7、MapReduce应用开发
  8、更多示例讲解,熟悉MapReduce算法原理
  1、使用压缩分隔减少输入规模
  2、利用Combiner减少中间数据
  3、编写Partitioner优化负载均衡
  4、如何自定义排序规则
  5、如何自定义分组规则
  6、MapReduce优化
  7、编程实战
五、Hadoop集群与管理,是数据库管理员的高级课程六、ZooKeeper基础知识,构建分布式系统的基础框架
  1、Hadoop集群的搭建
  2、Hadoop集群的监控
  3、Hadoop集群的管理
  4、集群下运行MapReduce程序
  1、ZooKeeper体现结构
  2、ZooKeeper集群的安装
  3、操作ZooKeeper
七、HBase基础知识,面向列的实时分布式数据库八、HBase集群及其管理
  1、HBase定义
  2、HBase与RDBMS的对比
  3、数据模型
  4、系统架构
  5、HBase上的MapReduce
  6、表的设计
  1、集群的搭建过程讲解
  2、集群的监控
  3、集群的管理
九、HBase客户端十、Pig基础知识,进行Hadoop计算的另一种框架
  1、HBase Shell以及演示
  2、Java客户端以及代码演示
  1、Pig概述
  2、安装Pig
  3、使用Pig完成手机流量统计业务
十一、Hive,使用SQL进行计算的Hadoop框架十二、Sqoop,Hadoop与rdbms进行数据转换的框架
  1、数据仓库基础知识
  2、Hive定义
  3、Hive体系结构简介
  4、Hive集群
  5、客户端简介
  6、HiveQL定义
  7、HiveQL与SQL的比较
  8、数据类型
  9、表与表分区概念
  10、表的操作与CLI客户端演示
  11、数据导入与CLI客户端演示
  12、查询数据与CLI客户端演示
  13、数据的连接与CLI客户端演示
  14、用户自定义函数(UDF)的开发与演示
  1、配置Sqoop
  2、使用Sqoop把数据从MySQL导入到HDFS中
  3、使用Sqoop把数据从HDFS导出到MySQL中
十三、Storm
  1、Storm基础知识:包括Storm的基本概念和Storm应用
     场景,体系结构与基本原理,Storm和Hadoop的对比
  2、Storm集群搭建:详细讲述Storm集群的安装和安装时
     常见问题
  3、Storm组件介绍: spout、bolt、stream groupings等
  4、Storm消息可靠性:消息失败的重发
  5、Hadoop 2.0和Storm的整合:Storm on YARN
  6、Storm编程实战
十四、论坛日志分析项目
  该项目的数据来自于某网站论坛的日志,它是为本课程量身定做的,非常适合我们Hadoop课程学习。有的同学觉得应该介绍更多项目,其实做过几个项目后,就会发现项目的思路是相同的,只是业务不同而已。
  大家写过这个项目后,就对Hadoop的各个框架在项目中是如何使用的,以及Hadoop与JavaEE结合有一个比较清晰的认识与了解。
  

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-85621-1-1.html 上篇帖子: hadoop job 下篇帖子: 【转】基于Hadoop平台的并行数据挖掘算法工具-Dodo
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表