设为首页 收藏本站
查看: 1310|回复: 0

[经验分享] Hadoop+集算器共同实现去IOE

[复制链接]
YunVN网友  发表于 2018-10-31 11:14:13 |阅读模式

什么是IOE?I=IBM,O=Oracle,E=EMC。他们代表着典型的高端数据库、数据仓库架构体系,如高端服务:HP、IBM、Fujitsu,高端数据库软件,Teradata,Oracle,Greenplum,高端存储设备:EMC,Violin,Fusion-io。

以往,这种典型的高性能数据库架构还是中大型企业的首选。它们运行稳定、性能出众,在信息化程度不高、企业应用简单的时代非常流行。但随着近几年信息爆发性增长和企业应用的多样化复杂化,去IOE的呼声逐渐成为主流,一大批企业实施了减少乃至完全取消高端数据库的计划,这其中包括Intel、阿里巴巴、Amazon、eBay、Yahoo、Facebook。
信息爆发性的增长意味着存储空间需求的快速增长,应用的多样化、复杂化意味着计算压力和并发访问的快速增大,更快频率的升级是唯一应对之道,而IOE的升级成本之高,已经越来越成为企业管理者沉重的压力。很多情况下,企业即使付出了高昂的升级成本,仍然要面临响应缓慢、高负载率的痛苦。这就是去IOE的根本原因。
Hadoop,是被企业管理者们给予厚望的去IOE解决方案。
它支持廉价桌面级磁盘,可取代IOE的高端存储介质。
它的HDFS文件系统,可取代IOE的磁盘柜,磁盘阵列所提供的数据冗余安全。
它支持廉价PC,可取代高端数据库服务器。
它是开源软件,无需为CPU数量、存储空间、用户许可协议支持额外的软件费用。
它支持并行计算,可进行低成本的横向扩容,可将计算压力、存储压力均衡分担在多台廉价PC上,付出较低成本就可以使存储空间、计算性能、并发数量远远超过IOE。这就是Hadoop被寄予厚望的原因。
但IOE有一项优势是Hadoop无法完全具备的,那就是数据计算能力。
数据计算是企业数据中心最重要的软件功能,在信息爆炸和竞争日益激烈的今天,业务逻辑复杂的数据计算已经是常态的,尤其是在一些重要的应用如企业决策、流程优化、绩效测算、时间控制、成本管理等。事实上,那些高喊去IOE的企业,大都不得不保留着相当部分的IOE。Hadoop计算能力的短板,使它仅仅用于计算简单的ETL、数据存储及查找,真正大规模用于业务数据计算的应用却非常困难。
集算器能够提供企业级数据库的计算能力,与Hadoop无缝配合可以充分发挥其优势,真正帮助企业实施去IOE。
集算器是专注于增强Hadoop能力的纯JAVA的并行计算框架。它可以通过JDBC访问Hive,也可以直接读写HDFS。它拥有完备的数据计算体系,尤其擅长业务逻辑复杂的、需要存储过程才能完成计算。
集算器可以理解为一种类似R语言的动态集合式语言,并在内核提供了对分布式并行计算的支持,程序员可在享受类似R语言的简捷语法的同时获得并行计算的高效。它专为数据计算而设计,专为数据处理而优化,对于复杂的分析类业务,其开发效率和计算性能都超过当前Hadoop下的解决方案。
集算器支持专业的数据脚本语言,它支持真正的集合数据类型,易于用户从业务角度设计算法,可轻松实现用户的复杂业务逻辑。另外,它还支持有序集合,可以自由地访问集合的成员并进行和序号相关的计算。集合的集合可以轻松表达复杂的分组形式,比如等值分组、对位分组、枚举分组。用户还可以像操作对象一样操作数据集中的单独记录。它的脚本是书写在网格中的,无需定义即可引用中间计算结果,它的代码编辑和调试功能完善。

Hadoop+集算器,可以充分弥补Hadoop的短板,使Hadoop真正能够替代IOE的绝大部分功能,同时计算性能大大提高。
  http://blog.sina.com.cn/s/blog_e4de31d00101el4y.html


运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-628894-1-1.html 上篇帖子: hadoop学习一:hadoop 集群搭建 下篇帖子: 提升Hadoop计算能力的并行框架
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表