jiay 发表于 2019-1-31 06:11:35

王家林每日大数据语录Spark篇0002

Spark基于RDD近乎完美的实现了分布式内存的抽象,且能够基于位置感知性调度、自动容错、负载均衡和高度的可扩展性,Spark中允许用户在执行多个查询时显式的将工作集缓存起来以供后续查询重用,这极大的提高了查询的速度。  




页: [1]
查看完整版本: 王家林每日大数据语录Spark篇0002