设为首页 收藏本站
查看: 1624|回复: 0

[经验分享] 初识hadoop

[复制链接]

尚未签到

发表于 2015-7-12 12:04:45 | 显示全部楼层 |阅读模式
  1.什么是hadoop ?
  hadoop是一个高度容差的分布式文件系统,采用Master/Slave结构.由HDFS,MapReduce,HBase,Hive,ZooKeeper组成,是Sun的Apache下的项目.
  2.hadoop为什么会出现?
  随着现代各类技术的发展,应用产生的数据与日据增.而数据存储密度增大的速度要远大于数据传输增大的速度.  
  处理这类问题的一种方法是将数据存储在多个磁盘中,对数据进行并行存取.这样可以使数据存取速度与并行运行的磁盘数量呈正比.
  3.多磁盘并行存取可能出现的问题.
  a.硬件故障.多磁盘运行比单磁盘运行出现硬件故障的可能性要大得多.解决这一问题的办法是采用冗余磁盘阵列.
  b.对数据的分拆和整合.将数据分拆用于存放于多个磁盘中;将数据整合来还原原数据.这个问题在hadoop中由MapReduce解决.
  4.为何不使用关系数据库而要使用hadoop?
  hadoop与关系数据库一个最大的不同在于它们结构化数据的数量.结构化数据指拥有准确定义的实体化数据.关系数据库是一个高度结构化的数据库.而hadoop是非结构化的数据库.它需要在处理的过程中解释数据.这为hadoop数据流的高速传输提供了条件,不用去处理和结构有关的事情.这样能有效的提高数据的存取速度.
  5.什么是MapReduce?
  MapReduce是hadoop中的数据分析和处理工具.用来分拆数据和整合数据.它使用一种key/value对的数据模型.value对应数据文件中的数据,key是人们根据数据格式设计出来用于标识value的值.
  MapReduce也是一个编程模型.程序员设计两个函数.Map和Reduce.系统根据Map函数对数据进行分拆,再存储,根据Reduce函数对数据进行整合以进行数据查询等操作.
  MapReduce相对网格计算(High Performance Compute,HPC)的优点在于数据的本地化.海量数据在结点之间的传输时间将成为网格计算对海量数据处理的瓶颈.
  

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-85804-1-1.html 上篇帖子: hadoop错误- Too many open files 下篇帖子: Hadoop:The Definitive Guid 总结 Chapter 1~2 初识Hadoop、MapReduce
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表