Hadoop命令手册
来源:互联网 发布:金太阳教育软件 编辑:程序博客网 时间:2024/06/01 15:59
命令手册
- 概述
- 常规选项
- 用户命令
- archive
- distcp
- fs
- fsck
- jar
- job
- pipes
- version
- CLASSNAME
- 管理命令
- balancer
- daemonlog
- datanode
- dfsadmin
- jobtracker
- namenode
- secondarynamenode
- tasktracker
概述
所有的hadoop命令均由bin/hadoop脚本引发。不指定参数运行hadoop脚本会打印所有命令的描述。
用法:hadoop [--config confdir] [COMMAND] [GENERIC_OPTIONS] [COMMAND_OPTIONS]
Hadoop有一个选项解析框架用于解析一般的选项和运行类。
命令选项S各种各样的命令和它们的选项会在下面提到。这些命令被分为 用户命令 管理命令两组。
常规选项
下面的选项被 dfsadmin, fs, fsck和 job支持。 应用程序要实现 Tool来支持 常规选项。
用户命令
hadoop集群用户的常用命令。
archive
创建一个hadoop档案文件。参考 Hadoop Archives.
用法:hadoop archive -archiveName NAME <src>* <dest>
distcp
递归地拷贝文件或目录。参考DistCp指南以获取等多信息。
用法:hadoop distcp <srcurl> <desturl>
fs
用法:hadoop fs [GENERIC_OPTIONS] [COMMAND_OPTIONS]
运行一个常规的文件系统客户端。
各种命令选项可以参考HDFS Shell指南。
fsck
运行HDFS文件系统检查工具。参考Fsck了解更多。
用法:hadoop fsck [GENERIC_OPTIONS] <path> [-move | -delete | -openforwrite] [-files [-blocks [-locations | -racks]]]
jar
运行jar文件。用户可以把他们的Map Reduce代码捆绑到jar文件中,使用这个命令执行。
用法:hadoop jar <jar> [mainClass] args...
streaming作业是通过这个命令执行的。参考Streaming examples中的例子。
Word count例子也是通过jar命令运行的。参考Wordcount example。
job
用于和Map Reduce作业交互和命令。
用法:hadoop job [GENERIC_OPTIONS] [-submit <job-file>] | [-status <job-id>] | [-counter <job-id> <group-name> <counter-name>] | [-kill <job-id>] | [-events <job-id> <from-event-#> <#-of-events>] | [-history [all] <jobOutputDir>] | [-list [all]] | [-kill-task <task-id>] | [-fail-task <task-id>]
pipes
运行pipes作业。
用法:hadoop pipes [-conf <path>] [-jobconf <key=value>, <key=value>, ...] [-input <path>] [-output <path>] [-jar <jar file>] [-inputformat <class>] [-map <class>] [-partitioner <class>] [-reduce <class>] [-writer <class>] [-program <executable>] [-reduces <num>]
version
打印版本信息。
用法:hadoop version
CLASSNAME
hadoop脚本可用于调调用任何类。
用法:hadoop CLASSNAME
运行名字为CLASSNAME的类。
管理命令
hadoop集群管理员常用的命令。
balancer
运行集群平衡工具。管理员可以简单的按Ctrl-C来停止平衡过程。参考Rebalancer了解更多。
用法:hadoop balancer [-threshold <threshold>]
daemonlog
获取或设置每个守护进程的日志级别。
用法:hadoop daemonlog -getlevel <host:port> <name>
用法:hadoop daemonlog -setlevel <host:port> <name> <level>
datanode
运行一个HDFS的datanode。
用法:hadoop datanode [-rollback]
dfsadmin
运行一个HDFS的dfsadmin客户端。
用法:hadoop dfsadmin [GENERIC_OPTIONS] [-report] [-safemode enter | leave | get | wait] [-refreshNodes] [-finalizeUpgrade] [-upgradeProgress status | details | force] [-metasave filename] [-setQuota <quota> <dirname>...<dirname>] [-clrQuota <dirname>...<dirname>] [-help [cmd]]
1. 不接受对名字空间的更改(只读)
2. 不复制或删除块
Namenode会在启动时自动进入安全模式,当配置的块最小百分比数满足最小的副本数条件时,会自动离开安全模式。安全模式可以手动进入,但是这样的话也必须手动关闭安全模式。-refreshNodes重新读取hosts和exclude文件,更新允许连到Namenode的或那些需要退出或入编的Datanode的集合。-finalizeUpgrade终结HDFS的升级操作。Datanode删除前一个版本的工作目录,之后Namenode也这样做。这个操作完结整个升级过程。-upgradeProgress status | details | force请求当前系统的升级状态,状态的细节,或者强制升级操作进行。-metasave filename保存Namenode的主要数据结构到hadoop.log.dir属性指定的目录下的<filename>文件。对于下面的每一项,<filename>中都会一行内容与之对应
1. Namenode收到的Datanode的心跳信号
2. 等待被复制的块
3. 正在被复制的块
4. 等待被删除的块-setQuota <quota> <dirname>...<dirname>为每个目录 <dirname>设定配额<quota>。目录配额是一个长整型整数,强制限定了目录树下的名字个数。
命令会在这个目录上工作良好,以下情况会报错:
1. N不是一个正整数,或者
2. 用户不是管理员,或者
3. 这个目录不存在或是文件,或者
4. 目录会马上超出新设定的配额。-clrQuota <dirname>...<dirname>为每一个目录<dirname>清除配额设定。
命令会在这个目录上工作良好,以下情况会报错:
1. 这个目录不存在或是文件,或者
2. 用户不是管理员。
如果目录原来没有配额不会报错。-help [cmd]显示给定命令的帮助信息,如果没有给定命令,则显示所有命令的帮助信息。
jobtracker
运行MapReduce job Tracker节点。
用法:hadoop jobtracker
namenode
运行namenode。有关升级,回滚,升级终结的更多信息请参考升级和回滚。
用法:hadoop namenode [-format] | [-upgrade] | [-rollback] | [-finalize] | [-importCheckpoint]
secondarynamenode
运行HDFS的secondary namenode。参考Secondary Namenode了解更多。
用法:hadoop secondarynamenode [-checkpoint [force]] | [-geteditsize]
tasktracker
运行MapReduce的task Tracker节点。
用法:hadoop tasktracker
- hadoop 命令手册
- hadoop 命令手册
- (转)hadoop 命令手册
- hadoop 命令手册
- hadoop 命令手册
- Hadoop命令手册使用指南
- Hadoop命令手册
- Hadoop-2.0命令手册
- Hadoop命令手册
- Hadoop-2.0命令手册
- Hadoop-2.0命令手册
- hadoop 命令手册
- Hadoop命令手册
- Hadoop-2.0命令手册 (转)
- Hadoop命令手册(收集中)
- 一步一步跟我学习hadoop(3)----hadoop命令手册
- Hadoop 手册
- Hadoop学习8_hadoop入门手册4:Hadoop【2.7.1】初级入门之命令:文件系统shell1
- 【LeetCode】Two Sum
- 分数统计
- Jenkins入门系列之——01第一章 Jenkins是什么?
- R200显示深度图
- 杂花生树(四十五)
- Hadoop命令手册
- yii2与swoole结合例子
- keepAlived+Nginx 高可用性(非抢占)负载均衡
- phpexcel居中
- ELK搭建简单的日志收集分析系统
- MySQL中判断字段是否是数字
- 12. Integer to Roman
- 屏幕适配完美解决方案
- Java 由今天往前推7天怎么算