,hadoop里有哪些机制?

用户投稿 72 0

关于“hadoop_streaming_php”的问题,小编就整理了【1】个相关介绍“hadoop_streaming_php”的解答:

hadoop里有哪些机制?

可以只用一行代码来运行MapReduce作业:JobClient.runJon(conf),Job作业运行时参与的四个实体:

1.JobClient 写代码,配置作业,提交作业。

2.JobTracker:初始化作业,分配作业,协调作业运行。这是一个java程序,主类是JobTracker。

3.TaskTracker:运行作业划分后的任务,即分配数据分配上执行Map或Reduce任务。

4.HDFS:保存作业数据、配置信息等,保存作业结果。

Map/Reduce 作业总体执行流程:

代码编写 ----> 作业配置 ----> 作业提交 ----> Map任务分配和执行 ----> 处理中间结果 ----> Reduce任务分配与执行 ----> 输出结果

而对于每个作业的执行,又包含:

输入准备 ----> 任务执行 ----> 输出结果

作业提交JobClient:

JobClient的runJob方法产生一个Jobclient实例并调用其submitJob方法,然后runJob开始循环吗,并在循环中调用getTaskCompetionEvents方法,获得TaskCompletionEvent实例,每秒轮询作业进度(后面有介绍进度和状态更新),把进度写到控制台,作业完成后显示作业计数器,若失败,则把错误记录到控制台。

到此,以上就是小编对于“hadoop_streaming_php”的问题就介绍到这了,希望介绍关于“hadoop_streaming_php”的【1】点解答对大家有用。

抱歉,评论功能暂时关闭!