Hadoop MapReduce 入门
介绍
MapReduce 架构与功能
为了实现其功能,该架构包含两个以控制器-操作员方式设计的主要处理元件。它们是:
1. Job Tracker:控制器。负责作业调度并向驻留在每个节点中的运算符组件发出执行命令。它还负责重新执行失败的任务。
2. 任务跟踪器:操作员。存在于每个节点上,执行指令并将反馈传回控制器组件。
如上所示,MapReduce 的运行分为两个阶段:map 阶段和 Reduce 阶段。
地图阶段
减少阶段
每个作业的 Reducer 数量是可配置的,可以在mapred-site.xml配置文件中设置。
处理阶段的 Reducer 获取 Mapper 阶段的输出并处理数据以生成最终输出,该输出由称为记录写入器的函数记录在 Hadoop 分布式文件系统 (HDFS) 内的输出文件中。
实例
结论
免责声明:本内容来源于第三方作者授权、网友推荐或互联网整理,旨在为广大用户提供学习与参考之用。所有文本和图片版权归原创网站或作者本人所有,其观点并不代表本站立场。如有任何版权侵犯或转载不当之情况,请与我们取得联系,我们将尽快进行相关处理与修改。感谢您的理解与支持!
请先 登录后发表评论 ~