用cloudera manager安装impala全过程以impala、hive、Spark性能比较--------(一)初次尝试用cloudera manager安装impala
来源:互联网 发布:黑胡桃沙发价格 知乎 编辑:程序博客网 时间:2024/05/22 03:24
最近实验室老师安排对现有的热门大数据仓库impala、hive、Spark的性能做一个横行比较,因为只是需要做横向比较,只是看看这几个热门技术到底哪个更快,所以决定在虚拟机上搭建环境。由于impala只能安装在cloudera公司的hadoop发行版上,所以我们用cloudera manager进行集群部署。
由于cloudera的hadoop与原生的hadoop有所区别,所以这次安装impala可以说相当曲折。我将以3篇文章来说明这次安装的过程。一:尝试用cloudera manager安装impala,虽然最后失败了,但为最后的成功打下了基础。二:手动安装CDH4及impala,这次hadoop能正常运行,hive也能正常工作,但impala缺少log4j文件失败。三:用cloudera manager部署集群,启动impala服务,测试hive和impala成功。
由于我们也是首次使用cloudera manager所以写的内用可能有一些不准确,如果有什么问题可以通过新浪微博和我交流。(西红水三 http://weibo.com/u/1831381457)
好了下面介绍我的安装过程,首先介绍一下一些专有名词:
Cloudera 是一个公司名字。Cloudera manager是这个公司的一个产品,通过cloudera manager可以使集群中主机自动安装hadoop,hive,zookeeper,impalal等组件,并可以控制启动服务。如图:
CDH4是cloudera公司的hadoop发行版。MRv1是mapreduce的一个较早版本。YARN是mapreduce的一个新版本。MRv1和YARN不能同时在一个主机中运行。
安装impala还需要一些条件:1.需要安装centos6.2系统。2.CDH4.1.0以上版本3.要在集群每个节点安装hive。4.hive的元数据库要使用mysql。5.每台主机hosts文件中都加入所有机器的IP地址和主机名的对应关系。好一切准备就绪可以安装cloudera manager了。
首先从cloudera网站下载cloudera manager安装文件cloudera-manager-installer.bin,这是个二进制文件,下载地址:https://ccp.cloudera.com/display/SUPPORT/Cloudera+Manager+Downloads。然后设置执行权限,chmod u+x cloudera-manager-installer.bin,关闭系统防火墙,service iptables stop,关闭selinux:setenforce 0或修改/etc/selinux/config:SELINUX=disabled;配置代理:在/etc/yum.conf加入如下内容:http_proxy=http://server:port。;最好在/etc/yum.conf增加timeout时间,timeout=55555。自己设置长点就行。接着就直接执行它安装。sudo./ cloudera-manager-installer.bin 安装过程中确保你这台机器联网。最后就是漫长的等待,我们用的是虚拟机,所以很慢用了1个多小时。安装后就可以在浏览器里输入http://localhost:7180/登陆cloudera manager管理界面,初始用户名是admin密码是admin。
登陆clouderamanager管理界面后,首次登陆会有个安装向导,选择你要安装的主机,选择你要安装的服务,然后安装,clouderamanager会自动连接你要安装的主机,并通过ssh连接控制你的主机自动安装组件。我同时对集群的3台主机进行安装,但我们的虚机上同时只能有一台可以上网,所以其它2两台就显示失败,但没关系,先不用管哪2台失败的,等连网那台虚机所有组件安装成功,点击页面上的重新安装所有失败安装就可以重新安装其它2台虚机。等所有机器都安装完了,点击下一步会显示你的机器已经加入管理主机。本以为这时大功告成,谁知道问题出现了,但我点击“主机”选项时,没有任何管理的主机,重新添加主机,结果是一样的。查看集群中的主机,各种服务已经安装,单用jps查看却没有启动任何进程。我试了各种方法都没有解决,最后决定放弃clouderamanager自动安装,改用手动安装集群,然后再集群上手动安装impala。
未完待续!!!!!!!
- 用cloudera manager安装impala全过程以impala、hive、Spark性能比较--------(一)初次尝试用cloudera manager安装impala
- 用cloudera manager安装impala全过程以impala、hive、Spark性能比较-(三)cloudera manager 安装impala成功并对impala、hive进行简单测试
- 用cloudera manager安装impala全过程以impala、hive、Spark性能比较--------(二)手动安装CDH4,hive,impala。
- Cloudera Manager 用parcel安装impala
- CDH5实践(二)Cloudera Manager 5安装Hive,HBase,Impala,Spark等服务
- cloudera-manager安装+CDH5.4.1部署+mysql+python+impala安装
- Cloudera Impala 安装配置
- cloudera impala安装完整版
- Cloudera Manager 4.5.1 Free Edition 安装Impala详解
- 基于Cloudera Manager配置Impala的资源管理
- Cloudera Impala
- 创建本地yum软件源,为本地Package安装Cloudera Manager、Cloudera Hadoop及Impala做准备
- Impala 安装笔记1一Cloudera CDH4.3.0安装
- Cloudera Impala 编译、安装与配置
- Cloudera impala简介及安装详解
- 手工安装配置Cloudera组件-Impala
- Cloudera Impala 编译、安装与配置
- Cloudera Impala 编译、安装与配置
- 华为:拿什么留住员工
- ERP与进销存、财务软件的区别
- jquery改变页面元素的属性
- 自考,认证学习,相关资料
- 文件命名表达式
- 用cloudera manager安装impala全过程以impala、hive、Spark性能比较--------(一)初次尝试用cloudera manager安装impala
- 接口是否可继承接口? 抽象类是否可实现(implements)接口? 抽象类是否可继承实体类(concrete class)?
- 黑马程序员- ASP.NET(2)学习日记
- PL/SQL 3.3以上的版本中,UTL_FILE包答应用户通过PL/SQL读写操作系统文件
- smarty安装于配置
- Android Call 功能在各个frameworks层中的结构整理 (一)
- django 模板html自动转义符号和处理字符串在序列中自动加u
- XML的控件问题,地址引用不一样
- opengl累积缓存