2312132145 发表于 2016-8-16 09:06:13

GlusterFS性能调优说明

概述

    GlusterFS性能调优基本思路主要包括三个部分,分别是硬件调优、操作系统调优和GlusterFS自身参数调优。

    正常情况下,当硬件购买之后,已经没有什么可调的空间,最多就是更换一些性能更高的磁盘,当然这对glusterfs来说对性能帮助已经非常大了,gluster对cpu本身要去并不是很高,性能瓶颈往往会出现在网络和磁盘这两块。

    操作系统性能调优空间也不是很大,主要还是配合特定的应用场景,如果gluster和其他应用分享计算资源的话,还需要考虑操作系统配置对其他应用的性能影响,从方便运维的角度看,不推荐gluster和其他应用共享计算资源。

    glusterfs自身性能调优对性能影响较大,好在默认情况下,gluster性能相关中继器都是打开的,默认都会提供比较高的性能,但是还是会有一些调优的空间,其中一个最主要的原因是gluster默认配置应对的是普通服务器,对于部署在高性能服务器上的gluster来说,可调的空间就更大,原因是高性能服务器会提供更多内存和CPU。

调优说明

    对gluster进行性能调优,主要调的是性能相关的中继器,默认情况下,所有的性能中继器都是打开的,给人的感觉就是没法调了,已经是最优了,但实际情况往往不是这样的,还是要根据具体的应用场景,有些性能中继器在特定场合下反而会降低性能,其实对gluster性能影响很大的是gluster集群的部署方案,如果部署比较合理,性能原生就比较好,不需要做过多的配置,这也印证了gluster的简单好用和高性能。

    gluster非常适合大文件读写的带宽型应用,诸如视频存储、HPC高性能计算、容器镜像存储、冷数据存储、日志存储、数据备份等应用场景。但gluster并不擅长小文件读写的IOPS型应用,需要综合硬件、软件和系统进行优化。

    这里提供一个推荐的配置项供参考:

项目推荐配置说明
单个集群规模64节点受集群管理模式限制,大规模集群有压力
每卷最大客户端数量<= 1000个Brick并发连接数量不能太大
每节点brick数量4-8个Brick进程太多占用系统资源,并且启动时会出现部分brick进程启动失败现象
单个brick容量<= 100 TB平衡容量与性能,本地文件系统限制
RAID/LVM多盘组成RAID单个Brick容量和性能,控制brick数量
Brick文件系统XFS稳定,16TB以上大容量,格式化快
卷类型哈希复制卷高可用,条带卷不成熟
数据网络10GbE内部通信不能有瓶颈,尤其是NAS协议
访问协议POSIX原生高可用,性能

    其他相关可调参数说明如下:

参数选项参数说明缺省值合法值
auth.allow / auth.rejectIP访问授权*(allow all)IP地址
cluster.min-free-disk剩余磁盘空间阈值,超出将进行数据均衡并记录日志10%百分比
network.frame-timeout请求等待时间1800s0-1800
network.ping-timeout客户端等待时间42s0-42
nfs.disabled关闭NFS服务offoff|on
performance.io-thread-countIO线程数160-65
performance.cache-refresh-timeout缓存校验周期1s0-61
performance.cache-size全局读缓存大小io-cahce: 32MBquick-read: 128MB
performance.io-thread-countI/O并发数量16非零整数
cluster.stripe-block-size条带大小128KB



yahoo008 发表于 2016-9-10 10:24:15

{:6_406:}{:6_406:}{:6_406:}{:6_406:}{:6_406:}{:6_406:}{:6_406:}{:6_406:}{:6_406:}{:6_406:}{:6_406:}{:6_406:}{:6_406:}
页: [1]
查看完整版本: GlusterFS性能调优说明