程序博客网 > 生物多样性保护网络

hadoop中mapred.tasktracker.map.tasks.maximum的设置

来源：互联网发布：生物多样性保护网络编辑：程序博客网时间：2024/05/16 02:34

目前，我们邮件的一部分log已经迁移到Hadoop集群上

并由Hive来执行相关的查询

hadoop中默认的mapred.tasktracker.map.tasks.maximum设置是2

也即：每一个tasktracker同时运行的map任务数为2

照此默认设置，查询80天某用户的操作日志，耗时5mins, 45sec

经过测试，发现将mapred.tasktracker.map.tasks.maximum设置为节点的cpu cores数目或者数目减1比较合适

此时的运行效率最高，大概花费3mins, 25sec

我们现在的机器都是8核的，所以最终配置如下：

<property>
    <name>mapred.tasktracker.map.tasks.maximum</name>
    <value>8</value>
    <description>The maximum number of map tasks that will be run
    simultaneously by a task tracker.
    </description>
</property>

而对于mapred.map.tasks（每个job的map任务数）值，hadoop默认值也为2

可以在执行hive前，通过set mapred.map.tasks=24来设定

但由于使用hive，会操作多个input文件，所以hive默认会把map的任务数设置成输入的文件数目

即使你通过set设置了数目，也不起作用…

0 0

生物多样性保护网络

生物多样性保护网络

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子导航音量键失灵怎么办煤气灶打不着火怎么办底盘油漆破了怎么办鳄鱼宝被骗了怎么办木蜡油干了怎么办树浇太多水怎么办金钱树叶尖黄了怎么办钱树叶子黄了怎么办金钱树叶子长斑怎么办金钱树条下垂怎么办金钱树有黄叶怎么办一叶兰叶尖发黄怎么办植物上有蜘蛛网怎么办植物叶子尖发黑怎么办一叶兰叶子密集怎么办金钱树烂茎了要怎么办金钱木叶子发软怎么办金钱木黄叶子怎么办阆中云天新里程怎么办王者代练封号怎么办宝妈奶水不足怎么办离别多近忧愁怎么办手把节断了怎么办 abs产品有料花怎么办水生向日葵枯了怎么办被领导当替罪羊怎么办结婚证内容有误怎么办结婚证没有档案怎么办结婚三十年离婚怎么办起诉没有结婚证怎么办小额网贷逾期怎么办狗狗之间打架怎么办暂停非柜面服务怎么办暂停非柜面交易怎么办计算器程序弄了怎么办网络发现已关闭怎么办审稿意见拒稿怎么办见相亲对象紧张怎么办台灯下写字反光怎么办发现有人想轻生怎么办炉石传说误分橙卡怎么办