博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
MapReduce的集群行为和框架
阅读量:6947 次
发布时间:2019-06-27

本文共 605 字,大约阅读时间需要 2 分钟。

MapReduce的集群行为

MapReduce的集群行为包括:

1、任务调度与执行

MapReduce任务由一个JobTracker和多个TaskTracker两类节点控制完成。
(1)JobTracker节点

(2)TaskTracker节点

(3)JobTracker节点和TaskTracker节点之间的关系

2、本地计算

3、Shuffle洗牌过程

4、合并Mapper输出

5、读取中间结果

6、任务管道

Map/Reduce框架

Hadoop Map/Reduce是一个使用简易的软件框架,基于它写出来应用程序能够运行在由上千个商用机器组成的大型集群上,

并以一种可靠容错方式并行处理上TB级别的数据集。

一个Map/Reduce作业(job)通常会把输入的数据集切分为若干独立的数据块,由Map任务(task)以完全并行的方式处理它们。

框架会对Map的输出先进性排序,然后把结果输入给Reduce任务。
通常作业的输入和输出都会被存储在文件系统中。
整个框架负责任务的调度和监控,以及重新执行已经失败的任务。

通常,Map/Reduce框架和分布式文件系统是运行在一组相同的节点上的,也就是说,计算节点和存储节点通常在一起。

这种配置允许框架在那些已经存好数据的节点上高效地调度任务,这可以使得整个集群的网络带宽被非常高效的利用。

MapReduce框架的组成

Map/Reduce的输入输出

转载地址:http://pcenl.baihongyu.com/

你可能感兴趣的文章
Ubuntu上搭建Hadoop环境
查看>>
是运维就必须硬起来,插件化运维系统思路
查看>>
ibatis bug
查看>>
L7 linux shell编程练习
查看>>
开会 顺口溜
查看>>
用PHP和树莓派开发一个比特币/以太坊交易机器人
查看>>
有热备,有事物损坏 薛忠权(ERIKXUE)
查看>>
MySQL入门(二)
查看>>
手把手教 centos+nginx1.3.9+php5.4.9+mysql5.5.28+memcached
查看>>
PHP设计模式(3)观察者模式
查看>>
数据库中的左连接(left join)和右连接(right join)区别
查看>>
spring data jpa 调用oracle 存储过程
查看>>
夺命雷公狗---无限极分类NO4
查看>>
Teams新功能更新【已发布】Teams PowerShell 命令详解
查看>>
我的友情链接
查看>>
Ansible快速开始-指挥集群
查看>>
Java容器详解(以Array Arrays ArrayList为例)
查看>>
Iterator和ListIterator迭代器
查看>>
思科默认 NAT timeout
查看>>
error 1067 (42000) at line 1:Invalid default value for 'id'
查看>>