企业大数据平台二:企业大数据平台环境准备
来源:互联网 发布:淘宝不能搜网盘 编辑:程序博客网 时间:2024/05/29 03:25
企业大数据平台二:企业大数据平台环境准备
标签(空格分隔): 企业大数据平台
- 企业大数据平台二企业大数据平台环境准备
- 一Hadoop发型版本
- 二准备工作
一,Hadoop发型版本
1,apache版本–开源版本
2,Cloudera版本:解决各个框架的兼容性问题和版本选择,修复了企业中一些常见的问题
http://archive.cloudera.com/cdh5/cdh/5.3.x--最稳定CM 5.3.x:集群管理工具http://archive.cloudera.com/cm5/
3,hortonworks版本
zeppelin:http://zeppelin.apache.org/
二,准备工作
1,安装规划
a,IP地址,主机名,映射
b,防火墙,端口,selinux
c,目录
–HDFS
NN:/data01/dfs/nn /data02/dfs/nn—dfs.namenode.name.dir
DN:/data01/dfs/dn /data01/dfs/dn—dfs.datanode.data.dir
–Zookeeper
datadir
–Kafka
dataDir
–所有框架组件的日志目录
2,机器
–磁盘阵列
系统盘:安装系统以及相关软件数据(raid1:将2块硬盘映射成一块磁盘–系统备份)
数据盘:存储数据/JBOD(提高性能)/raid 0
3,操作系统
–CentOS 6.x 64位
–RedHat 6.4 64位
选择桌面版本语言选择英文(中文容易出现问题)
4,–ip地址:集群所有机器的IP地址
尽可能在同一个网段上
尽可能,交换机在同一个机架上
192.168.252.141192.168.252.142192.168.252.143
5,–设置主机名称
vi /etc/sysconfig/networkcdh001.cluster.com--192.168.252.141cdh002.cluster.com--192.168.252.142cdh003.cluster.com--192.168.252.143
6,–设置IP和hostname的映射
192.168.252.141 cdh001.cluster.com cdh001192.168.252.142 cdh002.cluster.com cdh002192.168.252.143 cdh003.cluster.com cdh003
7,禁用IPV6地址(生产环境)
vi /etc/modprobe.d/dist.confecho " " >> /etc/modprobe.d/dist.confecho "alias net-pf-10 off" >> /etc/modprobe.d/dist.confecho "alias ipv6 off" >> /etc/modprobe.d/dist.conf
需要重启生效
8,创建普通用户
adduser clusterpasswd cluster
设置sudo权限
chmod u+x /etc/sudoers //添加写权限
vi /etc/sudoers第一行输入:cluster ALL=(root)NOPASSWD:ALL
chmod u-x /etc/sudoers //收回写权限
9,关闭防火墙
sudo service iptables stop //临时生效sudo chkconfig iptables off //永久生效
10,禁用sselinux
sudo vi /etc/sysconfig/selinuxSELINUX=disabled
需要重启生效
11,卸载系统自带的OpenJdk
sudo rpm -qa|grep javasudo rpm -e --nodeps xxxxxxxxxxx
12,设置文件打开数量和用户最大进程数
ulimit -a //查看文件打开数量ulimit -u //查看用户最大进程数
sudo vi /etc/security/limits.conf* soft nofile 32768* hard nofile 1048576* soft nproc 65536* hard nproc 65536* soft memlock unlimited* hard memlock unlimited
13,集群时间同步
–找一台服务器作为时间服务器:cdh001.cluster.com
sudo vi /etc/ntp.confrestrict 192.168.252.0 mask 255.255.255.0 nomodify notrap#server 0.centos.pool.ntp.org#server 1.centos.pool.ntp.org#server 2.centos.pool.ntp.orgserver 127.127.1.0 # local clockfudge 127.127.1.0 stratum 10
sudo vi /etc/sysconfig/ntpdSYNC_HWCLOCK=yes
sudo service ntpd startsudo chkconfig ntpd on
–在其他服务器上设置定时任务
crontab -e---------*/10 * * * * /usr/sbin/ntpdate cdh001.cluster.com---------service crond restart
0 0
- 企业大数据平台二:企业大数据平台环境准备
- 企业大数据平台三:企业大数据平台安装
- 企业大数据平台架构
- 企业大数据平台下数仓建设思路
- 企业大数据平台的集群的大小与配置
- 大数据可视化平台给企业带来的价值
- 企业大数据平台一:企业需求及相关的基本组件
- Oracle:企业大数据
- 大数据企业
- 企查查支撑8000万+企业数据的大数据平台技术选型与实现
- 金融科技&大数据产品推荐:蓝金灵—基于大数据的电商企业供应链金融服务平台
- 百度开放大数据平台接口,传统企业看到了新曙光。
- 【阿里在线技术峰会】李金波:企业大数据平台仓库架构建设思路
- 【阿里在线技术峰会】李金波:企业大数据平台仓库架构建设思路
- 7月21日 企业大数据平台仓库架构建设思路直播视频
- 四个策略“快又准”打造企业大数据分析平台
- 【阿里在线技术峰会】李金波:企业大数据平台仓库架构建设思路
- 【阿里在线技术峰会】李金波:企业大数据平台仓库架构建设思路
- 博弈论(一):Nim游戏
- servlet实现文件下载
- Java的设计模式——单例
- PHP file_get_content在远程通信之前的准备,服务器中json_decode解析详解
- HDU 5701 中位数计数
- 企业大数据平台二:企业大数据平台环境准备
- 博弈论(二):Sprague-Grundy函数
- onmouseover 鼠标移入
- Android-下拉刷新库
- 企业大数据平台三:企业大数据平台安装
- 正确理解ThreadLocal
- ubuntu14.04LTS 安装后几个基本设置
- Linux系统用户与用户组管理
- 程序员这样对待简历,你期望面试官怎么对待你?