HDFS的重要参数配置<一> JVM的配置
来源:互联网 发布:惠泽了知福建版 编辑:程序博客网 时间:2024/05/16 23:59
Hadoop正式上线之前,首先要调整的是各个进程的JVM参数设置,特别是对于HDFS Namenode来说。
HDFS的JVM参数配置文件: hadoop-env.sh
Namenode进程的JVM配置: HADOOP_NAMENODE_OPTS
Datanode进程的JVM配置:HADOOP_DATANODE_OPTS
client命令行的JVM配置:HADOOP_CLIENT_OPTS
对于Namenode而言, 由于元数据存储\操作都在内存中,所以Namenode JVM要根据集群规模设置,通常情况下换算公式为:
在HDFS中,任何block,文件或者目录在内存中均以对象的形式存储,每个对象约占150byte,如果有1000
0000个小文件,每个文件占用一个block,则namenode需要2G空间。如果存储1亿个文件,则namenode需要20G空间。这样namenode内存容量严重制约了集群的扩展。
参考:http://dongxicheng.org/mapreduce/hadoop-optimization-0/
JVM配置示例:
export HADOOP_NAMENODE_OPTS="-server -XX:ParallelGCThreads=4 -XX:+UseConcMarkSweepGC -XX:ErrorFile=/var/log/hadoop/$USER/hs_err_pid%p.log -XX:NewSize=10000m -XX:MaxNewSize=10000m -Xloggc:/var/log/hadoop/$USER/gc.log-`date +'%Y%m%d%H%M'` -verbose:gc -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -Xms20000m -Xmx20000m -Dhadoop.security.logger=INFO,DRFAS -Dhdfs.audit.logger=INFO,DRFAAUDIT ${HADOOP_NAMENODE_OPTS}"HADOOP_DATANODE_OPTS="-Xms1000m -Xmx1000m -Dhadoop.security.logger=ERROR,DRFAS ${HADOOP_DATANODE_OPTS}"
0 0
- HDFS的重要参数配置<一> JVM的配置
- 几个重要的jvm参数配置及建议
- 几个重要的jvm参数配置及建议
- JVM的配置参数
- Jvm的配置参数
- jvm参数的配置
- Hadoop的hdfs的配置参数详解
- JVM 几个重要的参数
- JVM 几个重要的参数
- 如何配置JVM的GC参数
- JVM参数配置的线上教训
- 一个性能较好的JVM参数配置
- 一个性能较好的JVM参数配置
- 一个性能较好的JVM参数配置
- 配置Tomcat中jvm的内存参数
- 线上服务的JVM参数配置
- 查询jvm可配置的参数
- mapreduce JVM参数配置的问题
- 【C/C++】概念:指针和引用的区别
- 颜色
- 程序中呼叫Class(类)
- LayoutInflater、View的绘制流程、自定义View、Invalidate和postInvalidate的区别
- [省选前题目整理][BZOJ 1059][ZJOI 2007]矩阵游戏(二分图最大匹配)
- HDFS的重要参数配置<一> JVM的配置
- A8U推一键上面洗车APP软件
- [leetcode]Length of Last Word (求最后一个单词的长度 C语言实现)
- U-Boot启动过程完全分析
- ProtoBuf开发者指南
- 每天linux命令_chmod
- 问题总结
- 开发证书和发布证书的配置(图解篇)
- 麦肯锡评12大颠覆性技术