大数据框架Hadoop(四)-MapReduce1

MapReduce概述

  • MapReduce是一种分布式计算模型,由Google提出,主要用于搜索领域,解决海量数据的计算问题。
  • MapReduce是分布式运行的,由两个阶段组成:Map和Reduce,Map阶段是一个独立程序,有很多节点同时运行,每个节点处理一部分数据。Reduce阶段是一个独立的程序,有很多节点同时运行,每个节点处理一部分数据。
  • MapReduce框架都有默认实现,用户只需要覆盖map()和reduce()两个函数,即可实现分布式计算。两个函数的形参和返回值都是<key,value>
Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×