Mapr使用数据(一)——使用NFS访问数据
来源:互联网 发布:linux touch cat 命令 编辑:程序博客网 时间:2024/04/28 13:00
不像其他的Hadoop发行版,只允许集群数据导入或导入作为批处理作业,MAPR让您安装群集本身通过NFS,使您的应用程序可以直接读取和写入数据。MAPR允许直接修改文件和多个并发读取,并通过POSIX语义写道。与NFS挂载的集群,可以直接读取和使用标准工具,应用程序和脚本写入数据。例如,您可以运行它输出到CSV文件中的MapReduce作业,然后通过NFS CSV文件直接导入到SQL。
MAPR出口每个集群的目录 / MAPR / <cluster NAME>
(例如, / MAPR / my.cluster.com
)。如果你创建一个挂载点的本地路径 / MAPR
,然后Hadoop的FS路径和NFS路径到集群将是相同的。这使得它很容易在工作通过NFS和Hadoop相同的文件。在多集群环境中,集群共享一个单一命名空间,你可以看到他们所有安装的顶层 / MAPR
目录。
此页面包含以下部分:
- 安装群集
- 在群集节点安装NFS来MAPR-FS
- 在Linux客户端挂载NFS
- 在Mac客户端挂载NFS
- 在Windows客户端挂载NFS
- 安装集群
- 要安装在群集上的Windows 7旗舰版或Windows 7企业版
- 要安装在其他Windows版本的集群
- 映射网络驱动器
- 要映射网络驱动器的映射网络驱动器的工具
- 配置UID和GID为NFS访问
- 要访问NFS共享时,系统是Active Directory域的一部分
- 若要从一个独立的系统访问NFS共享
- 安装集群
- 设置压缩和传输块大小
请参阅 设置MAPR NFS 设置NFS非标准端口上。
安装群集
在开始之前,请确保您知道在NFS的主机名和目录分享您计划安装。
示例:
USA-node01上:/ MAPR
-用于命令行安装NFS :/ / usa-node01/mapr
-从Mac Finder上安装
在群集节点安装NFS来MAPR-FS
要自动挂载NFS来MAPR-FS的群集上my.cluster.com
在/ MAPR
挂载点,添加下面一行到/选择/ MAPR / conf /中mapr_fstab
:
每次系统重新启动时,挂载点自动根据重建mapr_fstab
配置文件。
要手动挂载NFS来MAPR-FS在/ MAPR
挂载点:
- 建立一个挂载点NFS共享。例如:
sudo的MKDIR / MAPR
- 通过NFS挂载的集群。例如:
sudo的安装邻NOLOCK
USA-node01上:/ MAPR
/ MAPR
在Linux客户端挂载NFS
要安装自动在系统启动时,添加NFS mount到/ etc / fstab中
。例如:
要挂载的NFS Linux客户机上手动:
- 确保已安装NFS客户端。示例:
须藤yum的安装NFS-utils的
(Red Hat或CentOS的)命令和apt-get安装nfs-common来
(Ubuntu的)须藤的zypper安装NFS客户端
(SUSE)
- 列出NFS共享导出的服务器上。例如:
showmount显示-E USA-node01上
- 建立一个挂载点NFS共享。例如:
sudo的MKDIR / MAPR
- 通过NFS挂载的集群。例如:
sudo的安装邻NOLOCK
USA-node01上:/ MAPR
/ MAPR
在Mac客户端挂载NFS
要从命令行手动安装群集:
- 打开一个终端(单程是点击快速启动>打开终端)。
- 在命令行中输入下面的命令成为root用户:
sudo的庆典
- 列出NFS共享导出的服务器上。例如:
showmount显示-E USA-node01上
- 建立一个挂载点NFS共享。例如:
sudo的MKDIR / MAPR
- 通过NFS挂载的集群。例如:
sudo的安装邻NOLOCK
USA-node01上:/ MAPR
/ MAPR
- 列出所有安装的文件系统来验证集群安装。
安装
在Windows客户端挂载NFS
设置Windows NFS客户端需要你安装群集并正确配置的用户ID(UID)和组ID(GID),如下面的章节中描述。在所有情况下,Windows的客户端必须使用有效的UID和GID从Linux域访问NFS。不匹配的UID或GID会导致权限问题时,MapReduce作业尝试访问是从Windows复制过来的NFS共享文件。
安装集群
要安装在群集上的Windows 7旗舰版或Windows 7企业版
- 打开开始>控 制面板>程序。
- 选择Windows功能打开或关闭。
- 选择NFS服务。
- 单击OK(确定)。
- 安装群集,并使用它映射到一个驱动器映射网络驱动器的工具或命令行。例如:
安装邻NOLOCK
USA-node01上:/ MAPR
Z:
要安装在其他Windows版本的集群
- 下载并安装微软的Windows服务的Unix(SFU)。你只需要安装NFS客户端和用户名映射。
- 在SFU配置用户身份验证,以配合所使用的簇(LDAP或操作系统用户)的认证。你可以映射本地Windows用户集群Linux用户,如果需要的话。
- 一旦SFU安装和配置,安装群集,并使用它映射到一个驱动器映射网络驱动器的工具或命令行。例如:
安装邻NOLOCK
USA-node01上:/ MAPR
Z:
映射网络驱动器
要映射网络驱动器的映射网络驱动器的工具
- 打开开始>我的电脑。
- 选择工具>映射网络驱动器。
- 在映射网络驱动器窗口中,选择从一个未使用的驱动器盘符驱动器下拉列表中。
- 指定文件夹通过浏览MAPR集群,或者通过输入主机名和目录到文本字段中。
- 浏览MAPR集群或键入映射的文件夹的名称。此名称必须遵循联合国军司令部。或者,单击Browse ...按钮通过浏览可用的网络股,以找到正确的文件夹中。
- 选择登录时重新连接,每当你登录到计算机自动重新连接到MAPR集群。
- 单击Finish(完成)。
配置UID和GID为NFS访问
要访问NFS共享时,系统是Active Directory域的一部分
你必须指示NFS客户端访问AD服务器获得 uidNumber
和 gidNumber
。在一个较高的水平,该方法如下所示:
- 确保AD用户架构具有辅助类
的posixAccount
。 - 填充公元
uidNumber
和gidNumber
领域相匹配的uid
和gid的
从Linux。 - 配置NFS客户端查找
的uid
和gid的
在AD DS存储。
参见细节在这里: 。http://technet.microsoft.com/en-us/library/hh509016(V = WS.10)ASPX。
若要从一个独立的系统访问NFS共享
对于一个独立的Windows 7或Vista的机器(不使用Active Directory),Windows总是使用其配置的匿名UID和GID为NFS访问,默认情况下是-2。但是,您可以将Windows配置为使用特定的值,从而导致能够使用这些值来访问NFS。
UID和GID值设置在Windows注册表中,并是全球性的在Windows NFS客户端对话框。此解决方案可能无法正常工作,如果你的Windows中有每个谁需要访问NFS与他们自己的权限多用户,但是没有明显的方法来避免此限制。
这些值存储在注册表中路径 HKEY_LOCAL_MACHINE \ SOFTWARE \ MICROSOFT \ ClientForNFS \ CURRENTVERSION \默认
。这两个DWORD值 AnonymousUid
和 AnonymousGid
。如果它们不存在,则必须创建它们。
请参阅详细资料
设置压缩和传输块大小
在MAPR存储每个目录包 含一个名为的隐藏文件。dfs_attributes
来控制压缩和块大小。要改变这些属性,更改文件中的相应值。
例如:
有效值:
- 压缩:
LZ4
,LZF
,zlib的
,或假
- 块大小(以字节为单位):65535(64 K)或零(无块)的倍数。例如:
131072
您也可以使用设置压缩和块大小的Hadoop MFS命令。
默认情况下,MAPR不压缩文件,其文件扩展名表示他们已经压缩。是文件扩展名的默认列表如下:
- BZ2
- GZ
- LZO
- 瞬间
- TGZ
- tbz2的
- 拉链
- Ž
- Ž
- MP3
- JPG
- JPEG
- MPG
- MPEG
- AVI
- GIF
- PNG
文件扩展名不压缩的列表存储为逗号分隔值mapr.fs.nocompression
配置参数,并能与被修改的配置保存
命令。例如:
该列表可以与被视为配置负载
指令。例如:
- Mapr使用数据(一)——使用NFS访问数据
- Mapr使用数据(一)——使用NFS访问数据
- Mapr使用数据(四)——MAPR指标和工作绩效
- Mapr使用数据(五)——Maven资源库和工件MAPR
- Mapr使用数据(三)——配置应用程序
- Mapr使用数据(三)——配置应用程序
- Mapr使用数据
- Mapr使用数据(二)——来自apache的数据拷贝
- Mapr使用数据(二)——来自apache的数据拷贝
- Mapr搜索指南(一)——Mapr全文检索
- Mapr与Hive工作(二)——使用HiveServer2
- Mapr与Mapr-FS工作(一)——块大小
- 使用数据访问页
- 使用HttpWebResponse访问数据
- 使用NFS文件系统实现数据同步
- Mapr升级方案(一)——离线升级
- Mapr配置应用程序(一)——配置的容量
- MapR与Mahout工作(一)——Mahout升级
- Mapr使用数据
- 关于程序员的59条搞笑但却真实无比的编程语录
- 读书笔记-《基于Oracle的SQL优化》-第二章-1
- hibernate 注解
- Mapr使用数据(一)——使用NFS访问数据
- Mapr使用数据(一)——使用NFS访问数据
- Java JDK的安装以及CLASSPATH设置系统变量
- 没想到求最小公倍数最大公约束用到的竟然是同余定理,真心学习了~
- 注册表重定向
- mysql的log-bin设置开启失败的原因
- 手把手教你如何破解无线路由密码
- JSON入门小例子(转)
- win8应用商店中路径更改的办法
- Mapr使用数据(二)——来自apache的数据拷贝