y23335793 发表于 2019-2-1 07:58:09

分布式文件系统之MogileFS

  系统环境
1.系统环境:
# uname -smr
Linux 2.6.32-504.23.4.el6.centos.plus.x86_64 x86_64
# cat /etc/issue
CentOS release 6.6 (Final)
2.MogileFS规划:
数据库 (MySQL):192.168.10.241             (储存MogileFS元数据)
管理节点(tarckers):192.168.10.200:7001    (负责MogileFS的调度,管理)
存储节点(storage1):192.168.10.220:7500    (存储文件)
存储节点(storage2):192.168.10.231:7500    (存储文件)
反向代理服务器(Nginx):192.168.10.231:8080   (为MogileFS的Tracker提供反向代理服务)
  

  1.特性
1).工作于应用层:无需特殊的核心组件;
2).单点:三大组件(tracker,mogstore,database)皆可实现高可用;
3).自动文件复制:复制的最小单位不是文件,而是class;基于不同的class,文件可以被自动的复制到多个有足够存储空间的存储节点上;
4).传输中立,无特殊协议:可以通过NFS或HTTP协议进行通信;
5).简单的命名空间:文件通过一个给定的key来确定,是一个全局的命名空间;没有目录,基于域实现文件隔离;
6).不共享数据:无需通过昂贵的SAN来共享磁盘,每个存储节点只需维护自己所属的存储设备(device)  2.MogileFS架构(如果数据量较大可以对MySQL做主从,并使用amoeba实现读写分离)
http://s3.运维网.com/wyfs02/M00/6F/B0/wKiom1Wk1ZOjxpzlAADH0rsOij4019.jpg

Tracker:MogileFS的核心,是一个调度器;服务进程为mogilefsd;可以做负载均衡调度;

[*]主要职责有:
[*]数据删除;
[*]数据复制;
[*]监控:故障后生成新的数据副本;
[*]查询;
  

Database:Tracker访问Database,返回用户可用的Storage Node及文件的存放位置;
mogstored:数据存储的位置,通常是一个HTTP(WebDAV)服务器,用于数据的创建、删除、获取等;不可做负载均衡调度;
  

3. 组成
MogileFS由3部分组成:
    server:主要包括mogilefsd和mogstored两个应用程序。

[*]mogilefsd实现的是tracker,它通过数据库来保存元数据信息,包括站点domain、class、host等;
[*]mogstored是存储节点(store node),它其实是个WebDAV服务,默认监听在7500端口,接受客户端的文件存储请求。
    Utils(工具集):主要是MogileFS的一些管理工具,例如mogadm等;

[*]在MogileFS安装完后,要运行mogadm工具将所有的store node注册到mogilefsd的数据库里,mogilefsd会对这些节点进行管理和监控;
    客户端API:MogileFS的客户端API很多,例如Perl、PHP、Java、Python等,用这个模块可以编写客户端程序,实现文件的备份管理功能等;
  4.安装部署MogileFS(在192.168.10.220和192.168.100.231执行相同操作)
1.安装MogileFS分布式文件系统
    yum install perl perl-YAML
cpan -I Danga::Socket
cpan -I IO::AIO
cpan -INet::Netmask
cpan -I Perlbal
cpan -I DBD::mysql
cpan -I IO::WrapTie
tar xf MogileFS-Client-1.17.tar.gz
cd MogileFS-Client-1.17
perl Makefile.PL
make && make install
tar xf MogileFS-Server-2.72.tar.gz
perl Makefile.PL
make
make install
cpan -IMogileFS::Utils
2.MogileFS不能以root用户启动,必须为Mogilefs创建用户
useradd mogilefs
3. 增大打开文件数,并且重启服务器(默认1024)
vim /etc/security/limits.conf
*       soft    nofile          65535
*       hard    nofile          65535
4. 准备存储设备
mkdir /etc/mogilefs
mkdir -p /data/mogdata/dev1
将添加一块磁盘挂载至/data/mogdata/dev1
chown -R mogilefs /data/mogdata/dev1
5. 为MogileFS提供配置文件
# vim /etc/mogilefs/mogilefsd.conf #MogileFS(调度节点或管理节点)的配置文件
daemonize = 1
db_dsn = DBI:mysql:mogilefs:host=192.168.10.241;port=3306;mysql_connect_timeout=5
db_user = mogilefs
db_pass = mogilefs
trackers = 192.168.10.241
conf_port = 7001
listener_jobs = 5
node_timeout = 5
rebalance_ignore_missing = 1
query_jobs = 10
delete_jobs = 1
replicate_jobs = 5
reaper_jobs = 1
# vim /etc/mogilefs/mogilefs.conf #该文件在MogileFS的家目录下
trackers = 192.168.10.220:7001
# vim /etc/mogilefs/mogstored.conf #MogileFS的Storage(存储节点)的配置文件
maxconns = 10000
httplisten=0.0.0.0:7500
mgmtlisten=0.0.0.0:7501
docroot=/data/mogdata
chown -R mogilefs /etc/mogilefs/
6. 部署数据库,参照以前文章,配置数据库,保存MogileFS的元数据
创建数据库
mysql> CREATE DATABASE mogilefs;
mysql> GRANT ALL ON mogilefs.* TO 'mogilefs'@'%' IDENTIFIED BY 'mogilefs';
mysql> FLUSH PRIVILEGES;
mysql> quit
初始化Mogilefs存储元数据的数据库(执行一次即可)
$ mogdbsetup --dbhost=192.168.10.241 --dbname=mogilefs --dbuser=mogilefs --dbpassword=mogilefs --yes
启动Trackers
$ mogilefsd
启动Storage
$ mogstored -d  

  5.向MogileFS的Trackers节点添加host(主机),device(设备),domain(域),class(文件的最小复制单位)
添加节点
$ mogadm --trackers=192.168.10.220:7001 host add 192.168.10.220 --ip=192.168.10.220 --status=alive
$ mogadm --trackers=192.168.10.220:7001 host add 192.168.10.231 --ip=192.168.10.231 --status=alive
$ mogadm host list # 查看已添加节点
添加设备
$ mogadm device add 192.168.10.220 1
$ mogadm device add 192.168.10.231 2
$ mogadm device list # 查看已添加设备
在192.168.10.231 创建设备
mkdir -p /data/mogdata/dev2
chown -R mogilefs /data/mogdata/dev2
$ mogadm device list
192.168.10.220 : alive
                  used(G)    free(G)   total(G)weight(%)
    dev1:   alive      0.021      9.200      9.222      100
192.168.10.231 : alive
                  used(G)    free(G)   total(G)weight(%)
    dev2:   alive   16.371      9.725   26.096      100
   添加domain(域):
   $mogadm domain add images
   $ mogadm domain list
domain               class                mindevcount   replpolicy   hashtype
-------------------- -------------------- ------------- ------------ -------
images               default                   2      MultipleHosts() NONE
   添加class(文件类别)
   $ mogadm class add images upload1 --mindevcount=2 # 在域images中添加类别upload和upload2,最小文件复制份数为2
   $ mogadm class add images upload2 --mindevcount=2
   测试文件
   $ mogtool--trackers=192.168.10.220:7001 --domain=images inject /home/mogilefs/1.jpeg "1.jpeg"
   $ mogtool--trackers=192.168.10.220:7001 --domain=imagesinject/home/mogilefs/2.jpg "/2.jpg"
   $ moglistkeys   --domain=images                              
/2.jpg
1.jpeg
   查看文件信息
    $ mogfileinfo --domain=images --key='fish.jpg'
    - file: fish.jpg
   class:            default
   devcount:                  2
   domain:               images
   fid:                   15
   key:             fish.jpg
   length:                50040
   - http://192.168.10.220:7500/dev1/0/000/000/0000000015.fid
   - http://192.168.10.231:7500/dev2/0/000/000/0000000015.fid  6.通过Python脚本实现MogileFS文件的迁移,也可以结合Rsync实现备份:
#!/usr/bin/python
# Author:zhooukanggen
# Dump FileofMogileFS
import subprocess
import time
def MogileFS_Dump():
    moglistkeys = '/usr/local/bin/moglistkeys --trackers=127.0.0.1:7001 --domain=common_raw'
    Rest = subprocess.Popen(,stdout=subprocess.PIPE,shell=True).communicate().split('\n')
    for i in Rest:
      status = subprocess.call(['/usr/local/bin/mogfetch','--trackers=127.0.0.1:7001','--domain=common_raw','--key=' + i,'--file=./' + i])
    time.sleep(1)
    if status == 0:
      print "Success"
    else:
      print "Fail"
MogileFS_Dump()#导出文件
def MogileFS_Upload():
    Upload = subprocess.Popen(['ls -1 /home/web/mogilefs'],stdout=subprocess.PIPE,shell=True).communicate().split('\n')[:-1]
    for i in Upload:
      status = subprocess.call(['/usr/local/bin/mogupload','--trackers=192.168.10.220:7001','--domain=images','--key=' + i,'--file=/home/web/mogilefs/' + i])
    time.sleep(5)
    if status == 0:
      print "Success"
    else:
      print "Fail"

MogileFS_Upload() #导入文件  

  7.使用nginx作为MogileFS的反向代理
1. 安装nginx
# wget
# wget
# tar xf nginx-1.8.0.tar.gz
# tar xf nginx_mogilefs_module-1.0.4.tar.gz
# cd nginx-1.8.0 ./configure   \
    --prefix=/usr/local/nginx \
    --conf-path=/etc/nginx/nginx.conf \
    --error-log-path=/var/log/nginx/error.log \
    --http-log-path=/var/log/nginx/access.log \
    --pid-path=/var/run/nginx/nginx.pid\
    --lock-path=/var/lock/nginx.lock \
    --user=nginx \
    --group=nginx \
    --with-http_ssl_module \
    --with-http_flv_module \
    --with-http_stub_status_module \
    --with-http_gzip_static_module \
    --http-client-body-temp-path=/var/tmp/nginx/client/ \
    --http-proxy-temp-path=/var/tmp/nginx/proxy/ \
    --http-fastcgi-temp-path=/var/tmp/nginx/fcgi/ \
    --http-uwsgi-temp-path=/var/tmp/nginx/uwsgi \
    --http-scgi-temp-path=/var/tmp/nginx/scgi \
    --with-pcre --with-debug \
    --add-module=../nginx_mogilefs_module-1.0.4
    # make && make install
2. 配置nginx作为MogileFS的反向代理

    worker_processes1;
    events {
      worker_connections1024;
    }

    http {
      include       mime.types;
      default_typeapplication/octet-stream;
      log_formatmain'$remote_addr - $remote_user [$time_local] "$request" '
                        '$status $body_bytes_sent "$http_referer" '
                        '"$http_user_agent" "$http_x_forwarded_for"';

      sendfile      on;
      tcp_nopush   on;
      keepalive_timeout65;
   
      fastcgi_cache_path /var/tmp/nginx/fcgi levels=1:2 keys_zone=fcgicache:10m inactive=5m;
      server {
            listen       8080;
            server_namelocalhost;
            location / {
                root   html;
                indexindex.html index.htm;
            }
            error_page404            /404.html;

            error_page   500 502 503 504/50x.html;
            location = /50x.html {
                root   html;
            }
            location /images/ {
                mogilefs_tracker 192.168.10.220:7001;
                mogilefs_domain images;
      mogilefs_noverify on;
                mogilefs_pass{
                  proxy_pass $mogilefs_path;
                  proxy_hide_header Content-Type;
                  proxy_buffering off;
                }
            }
      }

    }
3. 启动nginx # /usr/local/nginx/sbin/nginx -c /etc/nginx/nginx.conf  

  8. 验证:
检查MogileFS
$ mogadm check
Checking trackers...
192.168.10.220:7001 ... OK
Checking hosts...
[ 1] 192.168.10.220 ... OK
[ 2] 192.168.10.231 ... OK
Checking devices...
    host device    size(G)    used(G)    free(G)   use%   ob state   I/O%
    ---- ------------ ---------- ---------- ---------- ------ ---------- -----         
    [ 1] dev1   9.222      0.040       9.182    0.43%    writeable   0.0
    [ 2] dev2   26.096   16.389      9.707    62.80%   writeable   N/A
    ---- ------------ ---------- ---------- ---------- ------            
                total:    35.318   16.429   18.88946.52%
获取详细状态
$ mogstats -c /etc/mogilefs/mogilefsd.conf
Fetching statistics... (all)
Statistics for devices...
device   host                   files   status
---------- ---------------- ------------ ----------
dev1       192.168.10.220      107      alive
dev2       192.168.10.231      107      alive
---------- ---------------- ------------ ----------
Statistics for file ids...
Max file id: 619 Statistics for files...
domain               class         files    size (m)fullsize (m)
-------------------- ----------- ---------- ----------- -------------
images               default         107          17            35
-------------------- ----------- ---------- ----------- -------------
Statistics for replication...
domain               class      devcount      files
-------------------- ----------- ---------- ----------
images               default             2      107
-------------------- ----------- ---------- ----------
Statistics for replication queue...
status                      count
-------------------- ------------
-------------------- ------------
Statistics for delete queue...
status                      count
-------------------- ------------
-------------------- ------------
Statistics for general queues...
queue         status                      count
--------------- -------------------- ------------
--------------- -------------------- ------------
done   
列出hots
$ mogadm host list
192.168.10.220 : alive
   IP:       192.168.10.220:7500
192.168.10.231 : alive
   IP:       192.168.10.231:7500
查看domain
$ mogadm domain list domain               
class                mindevcount   replpolicy   hashtype
-------------------- -------------------- ------------- ------------ -------
images               default                   2      MultipleHosts() NONE   
images               upload1                   2      MultipleHosts() NONE   
images               upload2                   2      MultipleHosts() NONE
查看host信息$ mogadm class list domain               
class                mindevcount   replpolicy   hashtype
-------------------- -------------------- ------------- ------------ -------
images               default                   2      MultipleHosts() NONE   
images               upload1                   2      MultipleHosts() NONE   
images               upload2                   2      MultipleHosts() NONE
查看设备信息
$ mogadm device list
192.168.10.220 : alive
                     used(G)    free(G)   total(G)weight(%)   
    dev1:   alive      0.039      9.183      9.222      100
192.168.10.231 : alive
                     used(G)    free(G)   total(G)weight(%)   
    dev2:   alive   16.389      9.707   26.096      100
添加文件
$ mogupload --domain=images--key='1.jpg' --file='/home/mogilefs/2.jpg'
查看key为1.jpg的信息
$ mogfileinfo --domain=images --key='1.jpg'
- file: 1.jpg
      class:            default
   devcount:                  2   
   domain:               images      
      fid:                  619      
      key:                1.jpg   
   length:               279696
- http://192.168.10.220:7500/dev1/0/000/000/0000000619.fid
- http://192.168.10.231:7500/dev2/0/000/000/0000000619.fid
导出文件
$ mogfetch --domain=images --key='1.jpg' --file='./test.jpg'  
  
  通过浏览器访问1.jpg
  http://s3.运维网.com/wyfs02/M01/6F/AD/wKioL1Wk3oHyCRODAAgjzsi49G4619.jpg
  使用将host(192.168.10.231)的状态修改为down,并通过浏览器访问1.jpg
$ mogadmhost modify 192.168.10.231 --ip=192.168.10.231 --status=down
$ mogadm host list
192.168.10.220 : alive
IP:       192.168.10.220:7500
192.168.10.231 : down
IP:       192.168.10.231:7500http://s3.运维网.com/wyfs02/M01/6F/B0/wKiom1Wk3Rfw-AsWAAiFPc8Yst0325.jpg
  注意 :

     1.当Sys-Syscal 使用 Sys-Syscall-0.25.tar.gz版本 会导致副本就只有一份(自身的bug),通过查找资料当Sys-Syscall模块需要使用 Sys-Syscall-0.23.tar.gz 副本就会恢复正常
     2.增大MogileFS用户最大打开文件数,重启服务器,如果不增大最大打开文件数,启动Mogstored就会报错ERROR: Need to be root to increase max connections.
  

  




页: [1]
查看完整版本: 分布式文件系统之MogileFS