hadoop默认端口

来源:互联网 发布:淘宝河南最大蛋糕 编辑:程序博客网 时间:2024/05/22 17:03

Hadoop默认端口说明


Hadoop集群的各部分一般都会使用到多个端口,有些是daemon之间进行交互之用,有些是用于RPC访问以及HTTP访问。而随着hadoop周边组件的增多,完全记不住哪个端口对应哪个应用,特收集记录如此,以便查询。

这里包含我们使用到的组件:HDFS, YARN, Hbase, Hive, ZooKeeper。

组件Daemon端口配置说明HDFSDataNode50010dfs.datanode.addressdatanode服务端口,用于数据传输  50075dfs.datanode.http.addresshttp服务的端口  50475dfs.datanode.https.addresshttps服务的端口  50020dfs.datanode.ipc.addressipc服务的端口 NameNode50070dfs.namenode.http-addresshttp服务的端口  50470dfs.namenode.https-addresshttps服务的端口  8020fs.defaultFS接收Client连接的RPC端口,用于获取文件系统metadata信息。 journalnode8485dfs.journalnode.rpc-addressRPC服务  8480dfs.journalnode.http-addressHTTP服务 ZKFC8019dfs.ha.zkfc.portZooKeeper FailoverController,用于NN HAYARNResourceManager8032yarn.resourcemanager.addressRM的applications manager(ASM)端口  8030yarn.resourcemanager.scheduler.addressscheduler组件的IPC端口  8031yarn.resourcemanager.resource-tracker.addressIPC  8033yarn.resourcemanager.admin.addressIPC  8088yarn.resourcemanager.webapp.addresshttp服务端口 NodeManager8040yarn.nodemanager.localizer.addresslocalizer IPC  8042yarn.nodemanager.webapp.addresshttp服务端口  8041yarn.nodemanager.addressNM中container manager的端口 JobHistory Server10020mapreduce.jobhistory.addressIPC  19888mapreduce.jobhistory.webapp.addresshttp服务端口HBaseMaster60000hbase.master.portIPC  60010hbase.master.info.porthttp服务端口 RegionServer60020hbase.regionserver.portIPC  60030hbase.regionserver.info.porthttp服务端口 HQuorumPeer2181hbase.zookeeper.property.clientPortHBase-managed ZK mode,使用独立的ZooKeeper集群则不会启用该端口。  2888hbase.zookeeper.peerportHBase-managed ZK mode,使用独立的ZooKeeper集群则不会启用该端口。  3888hbase.zookeeper.leaderportHBase-managed ZK mode,使用独立的ZooKeeper集群则不会启用该端口。HiveMetastore9083/etc/default/hive-metastore中export PORT=<port>来更新默认端口  HiveServer10000/etc/hive/conf/hive-env.sh中export HIVE_SERVER2_THRIFT_PORT=<port>来更新默认端口 ZooKeeperServer2181/etc/zookeeper/conf/zoo.cfg中clientPort=<port>对客户端提供服务的端口  2888/etc/zookeeper/conf/zoo.cfg中server.x=[hostname]:nnnnn[:nnnnn],标蓝部分follower用来连接到leader,只在leader上监听该端口。  3888/etc/zookeeper/conf/zoo.cfg中server.x=[hostname]:nnnnn[:nnnnn],标蓝部分用于leader选举的。只在electionAlg是1,2或3(默认)时需要。

所有端口协议均基于TCP。

对于存在Web UI(HTTP服务)的所有hadoop daemon,有如下url:

/logs
日志文件列表,用于下载和查看

/logLevel
允许你设定log4j的日志记录级别,类似于hadoop daemonlog

/stacks
所有线程的stack trace,对于debug很有帮助

/jmx
服务端的Metrics,以JSON格式输出。

/jmx?qry=Hadoop:*会返回所有hadoop相关指标。
/jmx?get=MXBeanName::AttributeName 查询指定bean指定属性的值,例如/jmx?get=Hadoop:service=NameNode,name=NameNodeInfo::ClusterId会返回ClusterId。
这个请求的处理类:org.apache.hadoop.jmx.JMXJsonServlet

而特定的Daemon又有特定的URL路径特定相应信息。

NameNode:http://:50070/

/dfshealth.jsp
HDFS信息页面,其中有链接可以查看文件系统

/dfsnodelist.jsp?whatNodes=(DEAD|LIVE)
显示DEAD或LIVE状态的datanode

/fsck
运行fsck命令,不推荐在集群繁忙时使用!

DataNode:http://:50075/

/blockScannerReport
每个datanode都会指定间隔验证块信息