mapreduce文档概述

来源:互联网 发布:python中单双引号 编辑:程序博客网 时间:2024/06/08 18:06
1.MapReduce 教程

文档简介 
这个文档描述所有用户认识hadoop mapreduce 框架和服务

英文网址
http://hadoop.apache.org/docs/r2.7.2/hadoop-mapreduce-client/hadoop-mapreduce-client-core/MapReduceTutorial.html


2.MapReduce命令指南

文档作用
所有的mapreduce命令通过 bin/mapred脚本调用。运行mapred脚本没有任何参数打印所有命令的描述。

英文网址:
http://hadoop.apache.org/docs/r2.7.2/hadoop-mapreduce-client/hadoop-mapreduce-client-core/MapredCommands.html


3. 迁移从Hadoop 1.x到 Hadoop 2.x

这个文档提供信息为用户迁移MapReduce 应用程序从Hadoop 1.x 到 Hadoop 2.x.

英文网址
http://hadoop.apache.org/docs/r2.7.2/hadoop-mapreduce-client/hadoop-mapreduce-client-core/MapReduce_Compatibility_Hadoop1_Hadoop2.html


4.Hadoop:加密的Shuffle

加密Shuffle能力允许MapReduce shuffle加密使用HTTPS 和带有选项的客户端身份认证(HTTPS双向认证或则HTTPS 客户端认证)

英文网址:
http://hadoop.apache.org/docs/r2.7.2/hadoop-mapreduce-client/hadoop-mapreduce-client-core/EncryptedShuffle.html


5.Hadoop的:可插拔Shuffle 和可插拔排序

可插拔的Shuffle 和排序能力允许可插拔更换内置的Shuffle 和排序逻辑备用的实现。

英文网址:http://hadoop.apache.org/docs/r2.7.2/hadoop-mapreduce-client/hadoop-mapreduce-client-core/PluggableShuffleAndPluggableSort.html


6.Hadoop的分布式缓存部署

MapReduce应用框架初步支持部署新版本的MapReduce framework通过分布式缓存。通过设置适当的配置属性,用户可以运行不同版本的MapReduce比最初部署到集群。举例,集群管理员可以放置多个版本的MapReduce 在HDFS和配置mapred-site.xml指定哪个版本的jobs使用默认。这个允许管理员执行滚动升级MapReduce 框架在一定条件下。

http://hadoop.apache.org/docs/r2.7.2/hadoop-mapreduce-client/hadoop-mapreduce-client-core/DistributedCacheDeploy.html
0 0
原创粉丝点击