初始Mapr(五)——安装 Mapr 软件

来源:互联网 发布:淘宝 消防工程师教材 编辑:程序博客网 时间:2024/05/22 12:03

当您计划在集群和编写的每个节点,你根据你的集群计划准备在每个节点上安装MAPR分布。

在整个集群中安装MAPR软件涉及执行的每个节点上的几个步骤。为了使安装过程更加简单,我们将推迟的Apache Hadoop的组件,如HBase的或蜂房的安装,直到第5步,安装Hadoop的组件。然而,有经验的管理员可以在如果需要同时MAPR软件安装这些组件。它通常是更容易安装的Hadoop生态系统组件之前,弹出MAPR Hadoop集群成功。

以下各节描述的步骤和选项可用于安装MAPR软件:

  • 准备包和库
    • 使用MAPR的互联网资料库
    • 使用本地存储库
    • 使用包含本地路径DEB包文件
  • 安装
    • 安装MAPR包
    • 验证安装是否成功
  • 设置环境变量
  • 配置与节点
  • 格式化磁盘与
  • 下一步

准备包和库

当安装MAPR软件,每个节点必须能够访问包文件。有几种方法可以指定包会。本节介绍提供给每个节点程序包的方式。选项​​有:

  • 使用MAPR的互联网资料库
  • 使用本地存储库
  • 使用包含本地路径DEB包文件

您还必须考虑到MAPR软件所依赖 ​​的所有软件包。你可以在开始MAPR安装过程之前,每个节点上安装的依赖,也可以指定存储库,并允许每个节点上的包管理器来解决依赖关系。见包和依赖关系MAPR软件的详细信息。

开始在2.0版本中,MAPR分离的分配分为两个版本库:

  • MAPR包这对于MAPR簇,如MAPR文件系统提供的核心功能
  • Hadoop的生态系统包这是不特定MAPR,如HBase的,蜂房和猪

使用MAPR的互联网资料库

互联网上的MAPR库中提供了所有你需要的顺序使用本机工具,如安装一个MAPR集群套件百胜在Red Hat或CentOS,或apt-get的 Ubuntu上。从MAPR的存储库中安装通常是用于安装的最简单的方法,但需要的带宽的最大量。使用这种方法,每个节点都必须连接到互联网,并会单独下载必要的软件包。

以下是有关设置库对于每个受支持的Linux发行版的说明。

 添加MAPR存储库上的Red Hat或CentOS
 添加MAPR存储库上的SUSE
 添加MAPR资源库在Ubuntu

使用本地存储库

你可以设置一个本地仓库每个节点上提供访问安装包。使用这种方法,每个节点上的包管理器从本地存储库中的包安装。节点不需要被连接到互联网。

下面是关于建立一个本地仓库为每个受支持的Linux发行版的说明。这些指令创建一个单一的储存库,包括MAPR组件和Hadoop的生态系统组成部分。

设置本地存储库中需要运行的节点访问下载包的Web服务器。建立一个Web服务器不记录在这里。

 建立在Red Hat或CentOS的本地存储库
 建立在SUSE的本地存储库
 建立在Ubuntu上的本地存储库

使用包含本地路径DEB包文件

您可以下载包文件,并将其储存在本地,并从那里安装。此选项用于未连接到Internet集群是有用的。

  1. 使用一台机器连接到互联网,下载压缩包为MAPR组件和Hadoop的生态系统组成部分,替换相应的<platform><VERSION><datestamp>
    • http://package.mapr.com/releases/v <VERSION> / <platform> / MAPR-V <VERSION> GA.rpm.tgz(或。deb.tgz
    • 例如,http://package.mapr.com/releases/v3.0.2/ubuntu/mapr-v3.0.2GA.deb.tgz。(见MAPR库和软件包档案馆为所有过去的版本中正确的路径。)

  2. 解压压缩包到本地目录,无论是在每个节点或所有节点访问本地网络上。

    焦油xvzf MAPR-V <VERSION> GA.rpm.tgz
    焦油xvzf MAPR - 生态系统 - <datestamp>。rpm.tgz

MAPR软件包的依赖关系需要在每个节点上,以便MAPR安装成功预装。如果你不使用的软件包管理器来安装从网上储存库的依赖,你需要手动下载和安装其他依赖包为好。

安装

之后使你的集群计划和准备包和库,你可以安装MAPR软件。

当你需要从你的集群计划如下:

  • 主机名(或IP地址)对所有CLDB节点列表
  • 主机名(或IP地址)对所有ZooKeeper的节点列表
  • 可用于MAPR群集上的所有​​节点上的所有磁盘和/或分区列表
图标

在开始之前,请确保所有节点满足安装要求。如果不能满足要求的节点是安装问题的主要原因。

对每个节点执行下列步骤:

  1. 安装计划MAPR服务
  2. 运行configure.sh脚本来配置该节点
  3. 格式使用分配给MAPR原始驱动器和分区disksetup脚本

    下表显示了一些可以在一个节点上运行的服务,并且包的名称用来安装服务。

服务

CLDB

MAPR-CLDB

JobTracker的

MAPR-JobTracker的

MAPR控制系统

MAPR-Web服务器

MAPR-FS文件服务器

MAPR - 文件服务器

指标

MAPR度量

NFS

MAPR-NFS

TaskTracker必须

MAPR-TaskTracker必须

动物园管理员

MAPR-饲养员

MAPR HBase的客户端

MAPR-HBase的- <VERSION> 
(参见上M7版#MAPR HBase的客户端安装。)

 

 

Hadoop的生态系统组成部分

使用MAPR测试版本,兼容并在某些情况下改善了部件

层叠

MAPR级联

水槽

MAPR-水槽

HBase的

MAPR-HBase的主 
MAPR-HBase的,regionserver

HCatalog

MAPR-hcatalog 
MAPR-hcatalog服务器

蜂巢

MAPR-蜂巢

亨利马乌

MAPR-象夫

Oozie的

MAPR-Oozie的

MAPR猪

Sqoop

MAPR-sqoop

呼呼

MAPR-呼呼

在M7版MAPR HBase的客户端安装

MAPR M7版,它引入了表存储在MAPR-FS,可在MAPR 3.0及更高版本。将访问表数据MAPR-FS节点必须具有MAPR HBase的客户端安装。包的名称是MAPR-HBase的- <VERSION>,其中<VERSION>匹配的HBase的API版本支持,如0.92.2和0.94.5。这个版本对使用的MAPR-FS文件服务器底层的存储格式没有影响。

如果您对HBase的API的特定版本编写的现有应用程序,使用相同的版本安装MAPR HBase的客户端软件包。如果您正在开发新的应用程序使用MAPR表完全是用MAPR HBase的客户端可用的最高版本。

安装MAPR包

根据您的集群计划的哪些服务在其上运行的节点,使用的命令本节以安装相应的软件包为每个节点。

您可以使用的软件包管理器,如百胜apt-get的,它会自动解析并安装软件包的依赖,提供必要的库已经被正确设置。或者,您也可以使用RPMdpkg的命令来手动安装,你已经下载并解压到本地目录文件包。

从存储库安装

 从存储库上的Red Hat或CentOS的安装
 从SUSE的存储库安装
 从Ubuntu的储存库安装

从包文件安装

从包文件安装时,您必须手动为了确保安装成功,预先安装任何依赖包。请注意,大多数MAPR包依赖的包MAPR核心。同样,许多Hadoop的生态系统组成部分有内部相关性,如HBase的内部MAPR-HBase的-regionserver。见包和依赖关系MAPR软件的详细信息。

在下面的命令,替换<VERSION>在包的文件名 ​​找到确切的版本字符串。例如,对于版本3.0.2,替代MAPR-核- <VERSION>。x86_64.rpmMAPR核-3.0.2.GA-1.x86_64.rpm

 从本地文件在Red Hat,CentOS的,或SUSE安装
 从Ubuntu的本地文件安装

验证安装是否成功

为了验证该软件已安装成功,请检查/选择/ MAPR /角色的每个节点上的目录。该软件安装在目录的/ opt / MAPR和一个文件中创建的/ opt / MAPR /角色对每一个安装成功的服务。检查这个目录来验证安装的节点。例如:

#ls-l的/选择/ MAPR /角色
共0
-rwxr-XR-X 1根根0 1月29日17:59文件服务器
-rwxr-XR-X 1根根0 1月29日17:58 TaskTracker必须
-rwxr-XR-X 1根根0 1月29日17:58网络服务器
-rwxr-XR-X 1根根0 1月29日17:58饲养员

设置环境变量

设置JAVA_HOME的/ opt / MAPR / conf /中env.sh。这个变量必须被设置在启动动物园管理员或监狱长之前。

如在说明设置其它环境变量MAPR 环境变量部分。

配置与节点configure.sh脚本

图标

首先配置该节点,然后准备原始磁盘和分区与disksetup命令。

图标

如果你打算授权您为M7集群,运行configure.sh与脚本-M7选项M7设置应用到该节点。如果M7许可证应用到集群中的节点都配置了M7设置之前,系统提高了NODE_ALARM_M7_CONFIG_MISMATCH报警。要清除报警,重新启动所有使用上的指示节点的文件服务器服务的服务页面。

脚本configure.sh配置一个节点是一个MAPR集群的一部分,或在集群中的现有节点上运行的修改服务。该脚本创建(或更新)的节点上运行与集群相关的配置文件和服务。在执行此步骤前,请确保您有CLDB的主机名和动物园管理员节点的列表。您可以选择性地指定CLDB和动物园管理员节点的端口也是如此。如果没有指定,默认的端口是:

  • CLDB - 7222
  • 动物园管理员 - 5181

该脚本configure.sh有一个可选的集群名称和日志文件,并CLDB和ZooKeeper的主机名或IP地址(以及可选端口)的逗号分隔的列表,使用下面的语法:

/选择/ MAPR /服务器/ configure.sh-C <HOST> [:<PORT>] [,<HOST> [:<PORT>] ...]-Z <HOST> [:<PORT>] [,<主机> [:<PORT>] ...] [-L <Logfile>中] [-N <cluster NAME>]

图标

您所指定的每一次[:<PORT>]-Z <HOST>选项,则必须使用相同的顺序为ZooKeeper的节点列表。如果更改顺序,任意节点,在动物园管理员领导人选举过程将失败。

例如:

/选择/ MAPR /服务器/ configure.sh-C r1n1.sj.us:7222 ,r3n1.sj.us:7222 ,r5n1.sj.us:7222 -Z r1n1.sj.us:5181 ,r2n1.sj.us :5181 ,r3n1.sj.us:5181 ,r4n1.sj.us:5181 ,r5n1.sj.us:5181 -N MYCLUSTER

格式化磁盘与disksetup脚本

如果MAPR-文件服务器安装在此节点上,请使用以下过程来格式化磁盘和分区供MAPR使用。

图标

运行configure.sh脚本(如上文所述)之前运行disksetup

disksetup脚本用于格式化磁盘的MAPR群集使用。创建一个文本文件的/ tmp / disks.txt列出磁盘和分区的节点上使用的MAPR。每行列出一个单一的磁盘或一个磁盘上的所有适用的分区。当在一行上列出多个分区,用空格分开。例如:

为/ dev / sdb的
/ dev/sdc1上/ dev/sdc2 / dev/sdc4
为/ dev / sdd的

后来,当你运行disksetup格式化磁盘,请指定disks.txt文件。例如:

/选择/ MAPR /服务器/ disksetup-F的/ tmp / disks.txt
图标

该脚本disksetup删除指定磁盘上的所有数据。请确保您正确指定的磁盘,您希望保留的数据已经备份到其他地方。

如果你重新使用已在另一个群集以前用过的一个节点,它格式化磁盘从旧集群中删除数据的任何痕迹是很重要的。

此过程假定你有空闲,卸载物理分区或硬盘供MAPR使用。如果您不能确定,请阅读设置磁盘的MAPR。

下一步

当你成功地在每个节点上安装MAPR软件会根据您的群集的计划,你就可以带出集群。

0 0
原创粉丝点击