设为首页 收藏本站
查看: 1074|回复: 0

[经验分享] eBay开源了其大型、高速SQL-on-Hadoop数据库

[复制链接]

尚未签到

发表于 2018-10-23 12:32:11 | 显示全部楼层 |阅读模式
  在线拍卖网站eBay开源了其名为Kylin的数据库技术,该公司表示这套方案能够对保存在Hadoop当中的PB级数据集进行快速查询。与谷歌以 及Facebook等企业相比,eBay并不能算是大数据用户,但该公司确实也在以相当可观的规模运行着Hadoop等技术方案,而Kylin项目似乎正 是其以此为基础实现技术创新的一个绝佳实例。

  eBay 公司在上个月二十号的一篇博文中公布了与Kylin项目相关的具体信息,在众多特性当中最引人注目的当数其REST API、ANSI-SQL兼容性、与Tableau以及Excel等分析工具的对接能力以及亚秒级的查询能力。不过,Kylin项目最为独特的能力还是要 数其在规模化层面的强大表现。根据eBay方面的说法,Kylin能够对百亿行数据进行查询——相当于体积超过14TB的数据集规模——而且速度表现优于 传统Apache Hive工具。

  总 体来看,Kylin的运作机制在于从Hive当中获取数据,利用MapReduce对大规模查询操作进行预处理,最后将处理结果以键-值“cuboid” 的形式保存在HBase当中。当某位用户利用一组特定变量运行一项Kylin查询时,这些变量所对应的值即可在无需重复处理的情况下直接交付给用户。虽然 与多年来业界一直在分析数据库当中所使用的cube并没有什么本质区别,但Kylin所采取的cuboid在设计思路上充分考虑到了HBase的数据结构 倾向。
  下面我们来看看eBay公司如何描述Kylin在其内部业务体系中的实际表现:
  在将Kylin贡献给开源社区的同 时,我们已经在eBay公司的多个业务部门当中将其应用于生产实践。其中规模最大的用例就是对由120多亿条源记录所生成的超过14TB cube数据进行分析。90%的查询请求在5秒之内。现在,我们拥有更多面向分析师以及业务用户的用例,他们能够访问并轻松通过Tableau仪表板获取 相关分析结果——而不再需要借助Hive查询或者shell命令等复杂机制。

  我 们期待着看到Kylin将如何与下一代Hive、Spark SQL以及其它Hadoop环境下的SQL分析项目进行协作,因为Apache Hadoop最新版本当中首度出现的YARN资源管理器方案必然将引发相关配合项目的一波升级浪潮。根据我的个人猜测,Kylin在速度表现上应该略逊于 内存内选项或者其它那些无需MapReduce处理机制介入的方案,但规模容纳能力方面却又比二者更强。有鉴于此,对于那些仍然在运行着早期软件版本的 Hadoop用户来说——这部分用户所占比例相当之高——Kylin堪称一套稳定而可靠的解决方案。

  •   相关文章推荐:
  •   如何用Eclipse正确导入开源库AndroidStaggeredGrid
  •   ENTBOOST v1.4发布,开源IM,增加管理中心
  •   11种方法助你成为开源编程能手
  •   本文来自:ubuntu技术网
  •   本文链接:http://www.ahlinux.com/open/9337.html


运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-625467-1-1.html 上篇帖子: server修改远程访问端口 下篇帖子: SQL Server 高可用方案
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表