Hadoop配置项整理(core-site.xml)

死siua11 发表于 2018-11-1 07:04:55

　　记录一下Hadoop的配置和说明，用到新的配置项会补充进来，不定期更新。以配置文件名划分
　　以hadoop 1.x配置为例
　　core-site.xml
namevalue Descriptionfs.default.namehdfs://hadoopmaster:9000定义HadoopMaster的URI和端口 fs.checkpoint.dir/opt/data/hadoop1/hdfs/namesecondary1定义hadoop的name备份的路径，官方文档说是读取这个，写入dfs.name.dir fs.checkpoint.period1800定义name备份的备份间隔时间，秒为单位，只对snn生效，默认一小时 fs.checkpoint.size33554432以日志大小间隔做备份间隔，只对snn生效，默认64M io.compression.codecs　　org.apache.hadoop.io.compress.DefaultCodec,
　　com.hadoop.compression.lzo.LzoCodec,
　　com.hadoop.compression.lzo.LzopCodec,
　　org.apache.hadoop.io.compress.GzipCodec,
　　org.apache.hadoop.io.compress.BZip2Codec
　　(排版调整，实际配置不要回车)
Hadoop所使用的编解码器，gzip和bzip2为自带，lzo需安装hadoopgpl或者kevinweil，逗号分隔，snappy也需要单独安装 io.compression.codec.lzo.classcom.hadoop.compression.lzo.LzoCodecLZO所使用的压缩编码器topology.script.file.name/hadoop/bin/RackAware.py机架感知脚本位置topology.script.number.args1000机架感知脚本管理的主机数，IP地址fs.trash.interval10800HDFS垃圾箱设置，可以恢复误删除，分钟数，0为禁用，添加该项无需重启hadoop hadoop.http.filter.initializers　　org.apache.hadoop.security.
　　AuthenticationFilterInitializer
　　(排版调整，实际配置不要回车)
　　需要jobtracker,tasktracker
　　namenode,datanode等http访问端口用户验证使用，需配置所有节点
hadoop.http.authentication.typesimple | kerberos | #AUTHENTICATION_HANDLER_CLASSNAME#验证方式，默认为简单，也可自己定义class,需配置所有节点 hadoop.http.authentication.　　token.validity
　　(排版调整，实际配置不要回车)
36000验证令牌的有效时间,需配置所有节点 hadoop.http.authentication.　　signature.secret
　　(排版调整，实际配置不要回车)
默认可不写参数默认不写在hadoop启动时自动生成私密签名,需配置所有节点 hadoop.http.authentication.cookie.domaindomian.tldhttp验证所使用的cookie的域名，IP地址访问则该项无效，必须给所有节点都配置域名才可以。 hadoop.http.authentication.　　simple.anonymous.allowed
　　(排版调整，实际配置不要回车)
true | false简单验证专用，默认允许匿名访问，true　　hadoop.http.authentication.
　　kerberos.principal
　　(排版调整，实际配置不要回车)
HTTP/localhost@$LOCALHOSTKerberos验证专用，参加认证的实体机必须使用HTTP作为K的Name hadoop.http.authentication.　　kerberos.keytab
　　(排版调整，实际配置不要回车)
/home/xianglei/hadoop.keytabKerberos验证专用，密钥文件存放位置 hadoop.security.authorizationtrue|falseHadoop服务层级验证安全验证，需配合hadoop-policy.xml使用，配置好以后用dfsadmin,mradmin -refreshServiceAcl刷新生效 io.file.buffer.size131072用作序列化文件处理时读写buffer的大小 hadoop.security.authenticationsimple | kerberoshadoop本身的权限验证，非http访问，simple或者kerberos hadoop.logfile.size1000000000设置日志文件大小，超过则滚动新日志 hadoop.logfile.count20最大日志数 io.bytes.per.checksum1024每校验码所校验的字节数，不要大于io.file.buffer.size io.skip.checksum.errorstrue | false处理序列化文件时跳过校验码错误，不抛异常。默认false io.serializations　　org.apache.hadoop.io.
　　serializer.WritableSerialization
　　(排版需要。实际配置不要回车)
序列化的编解码器 io.seqfile.compress.blocksize1024000块压缩的序列化文件的最小块大小，字节 webinterface.private.actionstrue | false设为true，则JT和NN的tracker网页会出现杀任务删文件等操作连接，默认是false　　结合Apache手册和公司里用的实际配置编写，实际根据硬件配置的不同，参数大小需做调整，目前参数基于namenode 96G内存，datanode 32G内存。有些har,s3,local这样的fs的implement因为不太会用到，所以没写。
　　水平有限，参数描述理解或翻译有误见谅。

页: [1]

运维网's Archiver

Hadoop配置项整理(core-site.xml)