Hadoop快速入门

zi663227 · 发表于 2018-10-29 08:08:08

　　提到列式(Column Family)数据库，就不得不提Google的BigTable，其开源版本就是我们熟知的HBASE。BigTable建立在谷歌的另两个系统GFS和Chubby之上，这三个系统和分布式计算编程模型MapReduce共同构成Google云计算的基础，Chubby解决主从自动切换的基础。接下来通过一个表格对比来引入Hadoop。
Google云计算Hadoop中的对应分布式文件系统GFSHDFS，负责数据物理存储分布式管理服务ChubbyZookeeper，负责管理服务器分布式计算框架MapReduceMapReduce，负责计算分布式数据库BigTableHBase，负责存取数据　　Hadoop是有Apache Lucene的作者Boug Cutting开发的，其主体结构如下图所示。

　　HDFS（Hadoop File System）
　　NameNode:整个文件系统的大脑，提供整个系统的目录信息并管理各个数据服务器。
　　DataNode:分布式文件系统中每一个文件被切割为若干数据块，每个数据块存储在不同服务器，这些就是数据服务器。
　　Block:每个被切分的数据块就是一段文件内容，其是基本的存储单位，被称为数据块，典型大小为64MB。
　　Tip:由于硬件错误是常态，HDFS是很多台Server的集合，因而错误检测和恢复是核心功能；其以流式读为主，做批量操作，关注数据访问的高吞吐量。
　　HDFS采用master/slave架构，一个HDFS集群由一个NameNode和若干DataNode组成，中心服务器NameNode负责管理文件系统的namespace和客户端对文件的访问。DataNode一般一个节点一个，负责管理节点上附带的存储。在内部，一个文件被分成一个或多个block，这些block存储在DataNode集合中。NameNode和DataNode均可运行在廉价的linux机器上，HDFS由java语言开发，跨平台好，总体结构示意图如下所示。

　　复制：采用rack-aware策略改进数据可靠性和网络带宽的利用；NameNode决定每个DataNode的Rack>　　NameNode用于存储元数据，任何修改均被Editlog记录，通讯协议基于TCP/IP，可以通过java API调用。
　　安装Hadoop，步骤如下所示

View Code

　　在分布式模式下，hadoop配置文件中不能使用ip，必须使用主机名，安装hadoop必须在所有节点上使用相同配置和安装路径，并用相同用户启动。Hadoop中的HDFS和Map-Reduce可以分别启动，NameNode和JobTracker可以部署到不同节点，但小集群一般在一起，注意元数据安全即可。
　　Hdfs常见操作，请见下表所示，在实践中，一般都是通过API调用，了解下就好
命令诠释命令诠释#catHadoop fs –cat uri输出内容#chgrp修改文件所属组#chmod修改文件去哪先#chown修改文件拥有者#put#copyFromLocal从本地文件系统复制到目标系统#get#getmerge#copToLocal复制文件到本地系统 Hadoop fs –gethdfs://host:port/user/Hadoop/file local file#cp复制文件#du，#dus显示目录、文件大小#expunge清空回收站#ls, lsr显示文件信息#mv#movefromLocal移动文件#rm #rmr删除文件#mkdir创建目录#setrep改变文件副本系数#stat返回统计信息 hadoop fs –stat path其他#tail #touchz#test#text　　通过Java调用hdfs的示例如下所示，其实就是一个文件系统

View Code

　　Map Reduce核心概念

　　Job: 用户的每一个计算请求就是一个作业
　　JobTracker:用户提交作业的服务器，同时它还负责各个作业任务的分配，管理所有的任务服务器。
　　Task:一个都需要拆分，交个多个服务器完成，拆分出来的执行单位就是任务
　　TaskTracker:就是任劳任怨的工人，负责执行具体的任务。

　　Map Reduce计算模型

　　在hadoop中，每一个MapReduce任务被初始化为一个Job,每个Job又被分为两个阶段：Map阶段、Reduce阶段。这两个阶段分别用两个函数表示，Map函数接受一个输入，然后产生一个的中间输出；之后hadoop会将具有相同中间key的value集合传给Reduce函数，之后Reduce处理后得到形式输出。

　　在Java中接入Hadoop的配置与代码如下所示。

View Code

　　MapReduce的数据流和控制流

　　zookeeper主要用来解决分布式应用中经常遇到的数据管理的问题，如统一命名服务、状态同步服务、集群管理和分布式应用配置项的管理，Zookeeper典型的应用场景(配置文件的管理、集群管理、同步锁、Leader选举和队列管理等)。
　　Zookeeper配置安装的步骤如下所示

View Code

　　ZooKeeper数据模型，其会维护一个层次关系的数据结构，非常类似标准文件系统

　　ZooKeeper的基础使用，其作为一个分布式服务框架，主要用于解决分布式集群的一致性问题，它提供类似文件系统目录节点树方式的数据存储，并会维护和监控数据的状态变化，其常见方法如下所示。
方法诠释Stringcreate创建一个给点的目录节点path并设置数据Statexists判断某个path是否存在，并设置监控这个目录节点Delete参数path对应目录节点StatsetData，getData设置数据，获取数据addAuthInfo将自己授权信息发送给服务器StatsetACL,getACL设置目录节点访问权限，获取权限列表　　java调用zookeeper的API示例如下

View Code

　　ZooKeeper的典型应用场景
　　统一命名服务(Name Service):分布式应用，通常需要一整套的命名规则，一般使用树形命名，这儿和JNDI很相似。
　　配置管理：ZooKeeper统一管理配置信息，保存在对应目录，一旦变化，对应机器就会收到通知(观察者)。
　　集群管理：ZooKeeper不仅能维护当前集群中及其的服务状态，并能选出一个总管(Leader Election)，从而避免单点故障，示例代码如下。
　　共享锁(Locks):共享锁在同一个进程容易实现，但再不同Server见不好实现，但Zookeeper却很容易实现，方式就是需要获取锁的Servere创建一个EPHEMERAL_SEQUENTIAL目录节点，然后调用getChildren方法获得当前目录节点列表中最小的目录节点，并判断，如果未自己建立，则获得锁，如果不是就调用exist方法监控节点变化，一直到自己创建的节点时最小，从而获得锁，释放很贱，只要删除前面自己创建的目录节点就OK。
　　队列管理(Queue Management):可以处理两类队列，一种是当成员齐聚时，队列才可用，否则一直等待，被称为同步队列；一种是按照FIFO方式进行入队和出队，例如实现生产-消费者模型。

　　HBase（逻辑结构）是BigTable的开源版，其建立在HDFS（物理结构）之上，提供高可靠性、高性能、列存储和可伸缩、实时读写的数据库系统。它结余NOSQL和RDBMS之间，仅能通过主键和主键range来检索数据，支持单行事务（可通过hive支持来实现多表join等复杂操作），主要用于存储非结构和半结构化的松散数据。与Hadoop一样，Hbase主要依靠横向扩展来提高计算和存储能力。
　　Hbase的表具有以下特点：
　　大：一个表可以有上亿行
　　面向列：面向列族的存储和权限控制，列族独立检索。
　　稀疏：对于空的列，并不占用空间，因此表可以设计的非常稀疏。

　　逻辑视图:HBase以表的形式存储数据，表由行和列组成，列划分为若干个列族row family,如下表所示。

Row KeyColumn-family1Column-family2Column1Column1Column1Column2Key1t2:abc t1:bcdt1:354Key2t3:efy t1:uiot2:tyi t1:456　　Row Key：检索数据的主键，访问HBase中的行，可以通过单个row key（字典序，数值型数据需要补0）访问；通过row key的range的访问；全表扫描。
　　列族：表中的每一列，都归属于列族，列族是表schema的一部分，必须在使用前定义，而列不是，关键理解。列名都以列族作为前缀，例如courses:history和courses:math都数据courses列族。
　　时间戳：通过row和column确定一个存储单元cell，每个cell保存同一份数据的多个版本，通过时间戳来索引。时间戳为64位证书，精确到毫秒，按时间倒序排列。为了避免版本过多，一般通过个数或时间来回收。
　　Cell:由{row key, column(=+),version}唯一确定的单元，cell中数据没有类型，以字节码存储。

　　物理存储：指如何将大表分布的存储在多台服务器。

　　特点：Table上所有行使用row key排列;Table在行方向上分割为多个HRegion;HRegion按大小分割，每个表已开始只有一个region，随着数据不断插入，region增大，当超过阈值是，会分裂成连个新的HRegion；HRegion是HBase中分布式存储和负载均衡最小单元，表示不同Region可以分布在不同RegionServer上；HRegion是分布式存储的最小单元，但不是最小存储单元，实际上，一个Region由多个Store组成，一个Store保存一个columns family，一个Store又由一个memStore和0-多个StoreFile（重点是StoreFile就是一个Hdfs中文件，通过压缩存储减少通信消耗，这儿就找到了对应关系，还可以细分，就不介绍了）组成。（脑海里有了大体的印象）

　　系统架构

　　Client：包含访问HBase接口，client维护一些cahce来加快访问，比如region未知信息。
　　ZooKeeper:保证任何时候集群只有一个master；存储所有region寻址接口；实施监控Region Server状态，将其上下线消息实时通知给master；存储Hbase的schema,包含哪些table,每个table的column family；为region server分配region；负责Region server的负载均衡；发现失效的Region Server并重新分配其上Region，GFS上的垃圾文件回收；处理schema更新请求。
　　Region Server：维护Master分配给它的Region，处理这些Region的IO请求；切分在运行中变得过大的Region。
　　Tip:可以看到client访问HBase数据的过程并不需要master参与，寻址访问zookeeper和Region Server，数据读写访问Region Server,master只维护table和Region的元数据，负载低。

　　关键算法和流程

　　Region定位：大表使用三层类似B+树的结构来存储Region位置，第一次保存zookeeper中数据，持有RootRegion位置；第二层RootRegion是.META表的第一个Region，其中保存了其他Region的位置；第三层是个特殊的表，存储HBase中所有数据表的Region位置信息。
　　读写过程：HBase使用MemStore和StoreFile存储对表的更新。数据在更新时首先写入Log和MemStore，MemStore中的数据是排序的，当MemStore累计到一定阈值，会创建新MemStore，并将老MemStore添加到Flush队列，有单独线程写到磁盘，称为一个StoreFile，同时系统会在zookeeper记录一个Redo point，表示更新已经持久化。系统出现问题是，可以使用log来恢复check point之后的数据。（思路和传统数据库一致）
　　Region分配：任何时刻，一个region只能分配给一个server，master记录了当前可用的Server以及当前region的分配情况，当存在未分配region且有server有可用空间时，master就给这个server发送一个装载请求，分配该region。
　　Region Server的上下线：master通过zookeeper来跟踪region server状态，当某个server启动时，会在zookeeper的server目录建立代表自己的文件，并获得该文件独占锁，由于master订阅了该目录的变更小心，因此当文件出现增删时，可以接到通知。下线时，断开与zookeeper会话，释放独占锁，这时master会发现并删除对应目录文件，并将原有region分配给其他server。
　　master的上下线：从zookeeper获取唯一master锁，阻止其他人称为master；扫描zookeeper上server目录，获得region server列表；与每个server通信，获得Region分配的情况；扫描META.region集合，计算得到当前未分配的region,放入待分配列表。

　　安装与配置

View Code

　　常见操作

　　比如创建一个如下表格
#name#grad#course:math#course:artXionger16260xiongda210098

View Code

　　Tip:
　　终于完成了，帅，这部分内容之后重点在于既有的集成解决方案，包括docker上的部署等。
　　此外，有空考虑区块链方面的学习，同时把数据结构好好再学习下，感觉还是不太OK。，比如B+树。

账号		自动登录	找回密码
密码			立即注册

Centos6.5×64安装配置openmeetings3.0.3详

大疆运维招人啦，

C++ :try 语句块和异常处理

C++的多态

Red Hat RHCE 8 (EX294) Cert Guide

Java/C++ 区别：看完这一篇，就够用！

别再用过时库了！这 13 个顶级 C++ 库才是

[经验分享] Hadoop快速入门

浏览过的版块

扫码加入运维网微信交流群