设为首页 收藏本站
查看: 1604|回复: 0

[经验分享] 《基于Apache Kylin构建大数据分析平台》

[复制链接]

尚未签到

发表于 2017-12-24 07:33:13 | 显示全部楼层 |阅读模式
  Kyligence联合创始人兼CEO,Apache Kylin项目管理委员会主席(PMC Chair)韩卿
  武汉市云升科技发展有限公司董事长,《智慧城市—大数据、物联网和云计算之应用》作者杨正洪
  万达网络科技集团大数据中心副总经理,《Spark高级数据分析》中文版译者龚少成
  数据架构师,IT脱口秀(清风那个吹)创始人,《开源大数据分析引擎Impala实战》作者贾传青
  等等业内专家联合推荐
  Apache Kylin是一个开源的分布式分析引擎,提供Hadoop之上的SQL查询接口及多维分析(OLAP)能力以支持超大规模数据,最初由eBay公司开发并贡献至开源社区。它能在亚秒内查询巨大的Hive表。
  本书分为21章,详细讲解Apache Kylin概念、安装、配置、部署,让读者对Apache Kylin构建大数据分析平台有一个感性认识。同时,本书从应用角度,结合Dome和实例介绍了用于多维分析的Cube算法的创建、配置与优化。最后还介绍了Kyligence公司发布KAP大数据分析平台,对读者有极大的参考价值。
  本书适合大数据技术初学者、大数据分析人员、大数据架构师等,也适合用于高等院校和培训学校相关专业师生教学参考。
  第一部分  Apache Kylin基础部分
  第1章  Apache Kylin前世今生 3
  1.1  Apache Kylin的背景 3
  1.2  Apache Kylin的应用场景 3
  1.3  Apache Kylin的发展历程 4
  第2章  Apache Kylin前奏 7
  2.1  事实表和维表 7
  2.2  星型模型和雪花型模型 7
  2.2.1  星型模型 7
  2.2.2  雪花型模型 8
  2.2.3  星型模型示例 8
  2.3  OLAP 9
  2.3.1  OLAP分类 9
  2.3.2  OLAP的基本操作 10
  2.4  数据立方体(Data Cube) 11
  第3章  Apache Kylin 工作原理和体系架构 12
  3.1  Kylin工作原理 12
  3.2  Kylin体系架构 13
  3.3  Kylin中的核心部分:Cube构建 15
  3.4  Kylin的SQL查询 16
  3.5  Kylin的特性和生态圈 16
  第4章  搭建CDH大数据平台 18
  4.1  系统环境和安装包 19
  4.1.1  系统环境 19
  4.1.2  安装包的下载 20
  4.2  准备工作:系统环境搭建 21
  4.2.1  网络配置(CDH集群所有节点) 21
  4.2.2  打通SSH,设置ssh无密码登录(所有节点) 21
  4.3  正式安装CDH:准备工作 29
  4.4  正式安装CDH5:安装配置 30
  4.4.1  CDH5的安装配置 30
  4.4.2  对Hive、HBase执行简单操作 39
  第5章  使用Kylin构建企业大数据分析平台的4种部署方式 41
  5.1  Kylin部署的架构 41
  5.2  Kylin的四种典型部署方式 42
  第6章  单独为Kylin部署HBase集群 44
  第7章  部署Kylin集群环境 58
  7.1  部署Kylin的先决条件 58
  7.2  部署Kylin集群环境 61
  7.3  为Kylin集群搭建负载均衡器 70
  7.3.1  搭建Nginx环境 70
  7.3.2  配置Nginx实现Kylin的负载均衡 73
  第二部分  Apache Kylin 进阶部分
  第8章  Demo案例实战 77
  8.1  Sample Cube案例描述 77
  8.2  Sample Cube案例实战 78
  8.2.1  准备数据 78
  8.2.2  构建Cube 81
  第9章  多维分析的Cube创建实战 89
  9.1  Cube模型 89
  9.2  创建Cube的流程 90
  9.2.1  步骤一:Hive中事实表,以及多张维表的处理 90
  9.2.2  步骤二:Kylin中建立项目(Project) 95
  9.2.3  步骤三:Kylin中建立数据源(Data Source) 95
  9.2.4  步骤四:Kylin中建立数据模型(Model) 98
  9.2.5  步骤五:Kylin中建立Cube 104
  9.2.6  步骤六:Build Cube 114
  9.2.7  步骤七:查询Cube 118
  第10章  Build Cube的来龙去脉 120
  10.1  流程分析 120
  10.2  小结 134
  第三部分  Apache Kylin 高级部分
  第11章  Cube优化 137
  第12章  备份Kylin的Metadata 142
  12.1  Kylin的元数据 142
  12.2  备份元数据 143
  12.3  恢复元数据 146
  第13章  使用Hive视图 147
  13.1  使用Hive视图 147
  13.2  使用视图实战 149
  第14章  Kylin的垃圾清理 153
  14.1  清理元数据 153
  14.2  清理存储器数据 154
  第15章  JDBC访问方式 157
  第16章  通过RESTful访问Kylin 161
  第17章  Kylin版本之间升级 179
  17.1  从1.5.2升级到最新版本1.5.3 179
  17.2  从1.5.1升级到1.5.2版本 180
  17.3  从Kylin 1.5.2.1升级到Kylin 1.5.3实战 181
  17.4  补充内容 187
  第18章  大数据可视化实践 189
  18.1  可视化工具简述 189
  18.2  安装Kylin ODBC驱动 190
  18.3  通过Excel访问Kylin 192
  18.4  通过Power BI访问Kylin 194
  18.4.1  安装配置Power BI 194
  18.4.2  实战操作 198
  18.5  通过Tableau访问Kylin 199
  18.6  Kylin   Mondrian  Saiku 205
  18.7  实战演练:通过Saiku访问Kylin 211
  18.7.1  第一个Schema例子:myproject_pvuv_cube的演示 211
  18.7.2  第二个Schema例子:kylin_sales_cube的演示 219
  18.7.3  Saiku使用的一些问题 223
  18.8  通过Apache Zepplin访问Kylin 229
  18.9  通过Kylin的“Insight”查询 232
  第19章  使用Streaming Table 构建准实时Cube 236
  第20章  快速数据立方算法 251
  20.1  快速数据立方算法概述 251
  20.2  快速数据立方算法优点和缺点 253
  20.3  获取Fast Cubing算法的优势 254
  第四部分  Apache Kylin的扩展部分
  第21章  大数据智能分析平台KAP 257
  21.1  大数据智能分析平台KAP概述 257
  21.2  KAP的安装部署 259

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-427417-1-1.html 上篇帖子: apache配置文件参数优化 下篇帖子: apache配置ssl
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表