MapReduce使用与原理(一)一个MapReduce程序由三部分组成:Mapper、Reducer、Dirver。Mapper编写Mapper部分需要用户自定义一个类,并继承Hadoop 中的Mapper类,Mapper以行为单位读取split中的数据,转换成K,V格式,K表示读取当前行数据的offset偏移量,V表示读取当前行数据的内容。针对读取过来的数据用户需要在自定义Mapper类中实现map方法完成相应业务逻辑处理数据,读取到的每行数据都会调用一次map方法,最终返回一条K,V对的数据,便于Reduce端拉取。