设为首页 收藏本站
查看: 827|回复: 0

[经验分享] 容器开启数据服务之旅系列(二):Kubernetes如何助力Spark大数据分析

[复制链接]

尚未签到

发表于 2018-9-15 12:32:39 | 显示全部楼层 |阅读模式
  摘要: 容器开启数据服务之旅系列(二):Kubernetes如何助力Spark大数据分析 (二):Kubernetes如何助力Spark大数据分析 概述 本文为大家介绍一种容器化的数据服务Spark + OSS on ACK,允许Spark分布式计算节点对阿里云OSS对象存储的直接访问。
  容器开启数据服务之旅系列(二):Kubernetes如何助力Spark大数据分析
  (二):Kubernetes如何助力Spark大数据分析
  概述
  本文为大家介绍一种容器化的数据服务Spark + OSS on ACK,允许Spark分布式计算节点对阿里云OSS对象存储的直接访问。借助阿里云Kubernetes容器服务与阿里云OSS存储资源的深度整合,允许Spark分布式内存计算,机器学习集群对云上的大数据直接进行分析和保存结果。
  先决条件
  你已经通过阿里云容器服务创建了一个Kubernetes集群,详细步骤参见创建Kubernetes集群
  从容器服务控制台创建一个Spark OSS实例
  使用三次点击来创建一个1 master + 3 worker 的Spark OSS的实例
  1 登录 https://cs.console.aliyun.com/
  2 点击 “应用目录”
  3 选择 "spark-oss", 点击 “参数”
  



  • 给你的应用一个名字, e.g. spark-oss-online2
  • (必选)填写你的oss_access_key_id和oss_access_key_secret
  

Worker:  

  # set OSS access keyID and secret
  oss_access_key_id:
  oss_access_key_secret:
  

  3.(可选)修改工作节点数目 Worker.Replicas: 3
  

  4 点击 “部署”
  5 点击 “Kubernetes 控制台”,查看部署实例

  6 点击 服务, 查看外部端点, 点击URL访问Spark集群

  
  7 测试Spark集群
  1.打开一个spark-shell
  

kubectl get pod | grep worker  

  spark-oss-online2-worker-57894f65d8-fmzjs 1/1 Running 0 44m
  spark-oss-online2-worker-57894f65d8-mbsc4 1/1 Running 0 44m
  spark-oss-online2-worker-57894f65d8-zhwr4 1/1 Running 0 44m
  

kubectl exec -it spark-oss-online2-worker-57894f65d8-fmzjs --  /opt/spark/bin/spark-shell --master spark://spark-oss-online2-master:7077  

  粘贴下列代码,使用Spark测试OSS的读写性
  

// Save RDD to OSS bucket  
val stringRdd = sc.parallelize(Seq("Test Strings\n Test String2"))
  
stringRdd.saveAsTextFile("oss://eric-new/testwrite12")
  

  
// Read data from OSS bucket
  
val lines = sc.textFile("oss://eric-new/testwrite12")
  
lines.take(10).foreach(println)
  

  Test Strings
  Test String2
  CLI 命令行操作
  Setup keys and deploy spark cluster in one command
  

export OSS_ID=
export OSS_SECRET=  

  
helm install -n myspark-oss --set "Worker.oss_access_key_id="$OSS_ID",Worker.oss_access_key_secret="$OSS_SECRET incubator/spark-oss
  

kubectl get svc| grep oss  
myspark-oss-master   ClusterIP      172.19.9.111              7077/TCP         2m
  
myspark-oss-webui    LoadBalancer   172.19.13.1     120.55.104.27   8080:30477/TCP   2m
  

  原文链接
  阅读更多干货好文,请关注扫描以下二维码:




运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-583549-1-1.html 上篇帖子: kubernetes集群问题排查 下篇帖子: 使用kubernetes的deployment进行RollingUpdate
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表