fjptec-xm 发表于 2019-1-30 11:22:10

spark内核

  

  术语解释

http://s3.运维网.com/wyfs02/M00/74/1E/wKioL1YVOS2RFXqZAAYxfnqkPtI595.jpg
  

  Executor多线程的方式运行
  

http://s3.运维网.com/wyfs02/M00/74/1E/wKioL1YVmEignP_YAALtIQJNXMo990.jpg
  

  每个partirion会被分配一个task
  

http://s3.运维网.com/wyfs02/M01/74/1E/wKioL1YVm77QPCgVAAMcMwO8Rgs285.jpg
  

  taskset就是stage,一个stage由多个task组成
  

  

http://s3.运维网.com/wyfs02/M01/74/51/wKioL1YZyV3hrLeDAAOBd63aRKM771.jpg
  

  

http://s3.运维网.com/wyfs02/M01/74/51/wKioL1YZzNnwFVzpAAJ6hr9BquA828.jpg
  

  广播变量类似于hadoop的DistributedCache
http://s3.运维网.com/wyfs02/M01/74/54/wKiom1YZ0gSgGdTUAAMECuMW0lA337.jpg
  

  

http://s3.运维网.com/wyfs02/M00/74/54/wKiom1YZ05WBkVXrAAJg-Kckg0U816.jpg
  

  

  




页: [1]
查看完整版本: spark内核