Hadoop源码分析36 Child的Reduce分析

来源：互联网发布：15万suv还是轿车知乎编辑：程序博客网时间：2024/06/13 21:34

分析任务reduce_1

args =[127.0.0.1, 42767, attempt_201405060431_0003_r_000001_0,/opt/hadoop-1.0.0/logs/userlogs/job_201405060431_0003/attempt_201405060431_0003_r_000001_0,1844231936]

myTask = JvmTask{ shouldDie=false, t=ReduceTask{jobFile="/tmp/hadoop-admin/mapred/local/taskTracker/admin/jobcache/job_201405060431_0003/job.xml",taskId=attempt_201405020918_0003_r_000001_0,taskProgress=reduce,taskStatus=ReduceTaskStatus{UNASSIGNED}} }

job=JobConf{Configuration:core-default.xml, core-site.xml, mapred-default.xml,mapred-site.xml, hdfs-default.xml, hdfs-site.xml,/tmp/hadoop-admin/mapred/local/taskTracker/admin/jobcache/job_201405060431_0003/job.xml}

outputFormat= TextOutputFormat@51386c70

committer = FileOutputCommitter{outputFileSystem=DFSClient,

outputPath=/user/admin/out/123 ,

workPath=hdfs://server1:9000/user/admin/out/123/_temporary/_attempt_201405060431_0003_r_000001_0}

ReduceCopier的workDir=/tmp/hadoop-admin/mapred/local/taskTracker/admin/jobcache/job_201405020918_0003/_attempt_201405060431_0003_r_000001_0

ReduceCopier的jar=/tmp/hadoop-admin/mapred/local/taskTracker/admin/jobcache/job_201405020918_0003/jars/job.jar

ReduceCopier的jobCacheDir=/tmp/hadoop-admin/mapred/local/taskTracker/admin/jobcache/job_201405020918_0003/jars

ReduceCopier的numCopiers = 5

ReduceCopier的maxInFlight= 20

ReduceCopier的combinerRunner=CombinerRunner{job={Configuration: core-default.xml,core-site.xml, mapred-default.xml, mapred-site.xml,hdfs-default.xml, hdfs-site.xml,/tmp/hadoop-admin/mapred/local/taskTracker/admin/jobcache/job_201405020918_0003/job.xml,committer=null,keyClass=org.apache.hadoop.io.Text,valueClass=org.apache.hadoop.io.IntWritable},

ReduceCopier的combineCollector =Task$CombineOutputCollector@72447399{progressBar=10000,}

ReduceCopier的ioSortFactor=10

ReduceCopier的maxInMemOutputs=1000

ReduceCopier的maxInMemOutputs=0.66

ReduceCopier的maxRedPer=0.0

ReduceCopier的ramManager=ReduceTask$ReduceCopier$ShuffleRamManager@46e9d255 {maxSize=141937872, maxSingleShuffleLimit=35484468}

ReduceCopier的线程copiers={

[Thread[MapOutputCopierattempt_201405020918_0003_r_000000_1.0,5,main],

Thread[MapOutputCopierattempt_201405020918_0003_r_000000_1.1,5,main],

Thread[MapOutputCopierattempt_201405020918_0003_r_000000_1.2,5,main],

Thread[MapOutputCopierattempt_201405020918_0003_r_000000_1.3,5,main],

Thread[MapOutputCopierattempt_201405020918_0003_r_000000_1.4,5,main]]}

ReduceCopier的线程localFSMergerThread=Thread[Threadfor merging on-disk files,5,main]

ReduceCopier的线程inMemFSMergeThread=Thread[Threadfor merging in memory files,5,main]

ReduceCopier的线程getMapEventsThread=Thread[Threadfor polling Map Completion Events,5,main]

线程getMapEventsThread的RPC请求:getMapCompletionEvents(JobID=job_201405060431_0003,fromEventId=2, MAX_EVENTS_TO_FETCH= 10000,TaskID=attempt_201405060431_0003_r_000001_0,jvmContext={jvmId=jvm_201405060431_0003_r_1844231936,pid= 10727 })

线程getMapEventsThread的RPC响应：

[Task Id : attempt_201405060431_0003_m_000001_0,Status : SUCCEEDED,

Task Id : attempt_201405060431_0003_m_000000_0,Status : SUCCEEDED]

放入mapLocations={

server2=[ReduceTask$ReduceCopier$MapOutputLocation{taskAttemptId=attempt_201405060431_0003_m_000000_0,taskId=task_201405060431_0003_m_000000,taskOutput=http://server2:50060/mapOutput?job=job_201405060431_0003&map=attempt_201405060431_0003_m_000000_0&reduce=0}],

server3=[ReduceTask$ReduceCopier$MapOutputLocation{taskAttemptId=attempt_201405060431_0003_m_000001_0,taskId=task_201405060431_0003_m_000001,taskOutput=http://server3:50060/mapOutput?job=job_201405060431_0003&map=attempt_201405060431_0003_m_000001_0&reduce=0}]

}

混洗server，打乱server的顺序：

hostList.addAll(mapLocations.keySet());

Collections.shuffle(hostList,this.random);

再一个个放入容器：

uniqueHosts.add(host);

scheduledCopies.add(loc);

主线程唤醒MapOutputCopier线程：scheduledCopies.notifyAll()

线程MapOutputCopier的HTTP请求：http://server3:50060/mapOutput?job=job_201405060431_0003&map=attempt_201405060431_0003_m_000000_0&reduce=1

因数据比较少，写到内存中（shuffleData->mapOutput.data->ReduceCopier.mapOutputsFilesInMemory ）

线程MapOutputCopier的HTTP请求：http://server2:50060/mapOutput?job=job_201405060431_0003&map=attempt_201405060431_0003_m_000001_0&reduce=1

因数据比较少，写到内存中（shuffleData->mapOutput.data->ReduceCopier.mapOutputsFilesInMemory ）

更新copyResults={CopyResult{MapOutputLocation=http://server3:50060/mapOutput?job=job_201405060431_0003&map=attempt_201405060431_0003_m_000000_0&reduce=1}，CopyResult{MapOutputLocation=http://server2:50060/mapOutput?job=job_201405060431_0003&map=attempt_201405060431_0003_m_000001_0&reduce=1}}

Merge内容：reduceCopier.createKVIterator(job,rfs, reporter)

合并两部分到：/tmp/hadoop-admin/mapred/local/taskTracker/admin/jobcache/job_201405060431_0003/attempt_201405060431_0003_r_000001_0/output/map_0.out

这里用的也是优先级队列(小根堆Heap)

添加到mapOutputFilesOnDisk = {/tmp/hadoop-admin/mapred/local/taskTracker/admin/jobcache/job_201405060431_0003/attempt_201405060431_0003_r_000001_0/output/map_0.out}

因为只有一个文件，故而不需要继续Merge。

运行reduce：reducer.run(reducerContext)

RPC请求：commitPending(taskId=attempt_201405060431_0003_r_000001_0,taskStatus=COMMIT_PENDING,jvmContext);

RPC响应：无

RPC请求：canCommit(taskId=attempt_201405060431_0003_r_000001_0，jvmContext);

RPC响应：true

提交任务：

复制hdfs://server1:9000/user/admin/out/123/_temporary/_attempt_201405060431_0003_r_000001_0/part-r-00001

到:/user/admin/out/123/part-r-00001

最后的CleanUp Task：

[127.0.0.1, 42767,attempt_201405060431_0003_m_000002_0,/opt/hadoop-1.0.0/logs/userlogs/job_201405060431_0003/attempt_201405060431_0003_m_000002_0,47579841]

JvmTask={ shouldDie=false，t=MapTask {jobCleanup=true,jobFile="/tmp/hadoop-admin/mapred/local/taskTracker/admin/jobcache/job_201405060431_0003/job.xml}}

删除文件:/user/admin/out/123/_temporary

创建文件：/user/admin/out/123/_SUCCESS

删除文件：hdfs://server1:9000/tmp/hadoop-admin/mapred/staging/admin/.staging/job_201405060431_0003

0 0