我的理解2 hadoop不会替换传统数据库

上都海奶茶馆 · 发表于 2016-12-11 09:18:39

主要功能：分析广告，用户打分，分析用户行为，统计日志，数据挖掘

facebook就用Hive来进行日志分析，2009年时facebook就有非编程人员的30%的人使用HiveQL进行数据分析；淘宝搜索中的自定义筛选也使用的Hive；利用Pig还可以做高级的数据处理，包括Twitter、LinkedIn 上用于发现您可能认识的人，可以实现类似Amazon.com的协同过滤的推荐效果。淘宝的商品推荐也是！

Facebook使用的数据仓库都是在Oracle系统上实现的。在我们遇到可扩展性和性能方面的问题之后，开始调查是否有开源技术能够应用到我们的环境中。
分析广告，用户打分，分析用户行为

Hadoop是数据仓库的补充，不是数据仓库的替代品。HDFS是文件系统，而不是数据库管理系统。
它分析的是
能够对数据集进行管理是数据管理系统很重要的特性之一，这一点HDFS是不具备的。

　　数据库管理系统中，我们通过查询索引可以实现对数据的随机访问，它往往处理的是结构化的数据，而在Hadoop中不会处理这样的数据类型。

对于Hive/Hadoop的使用并不是意味着将会完全放弃原来传统的数据库(Oracle/MySQL)，而且把Hadoop/Hive看做是数据库仓库的和应用操作层的交集

图： Facebook的数据仓库架构

账号		自动登录	找回密码
密码			立即注册

大疆运维招人啦，

C++ :try 语句块和异常处理

C++的多态

Red Hat RHCE 8 (EX294) Cert Guide

Java/C++ 区别：看完这一篇，就够用！

别再用过时库了！这 13 个顶级 C++ 库才是

c++ size_t 和 int 的区别

[经验分享] 我的理解2 hadoop不会替换传统数据库

浏览过的版块

扫码加入运维网微信交流群