Python 中的 Map 和 Reduce 详解

mapreduce 是 Python 中函数式编程 的核心工具,专门用于批量处理数据聚合计算,代码简洁且高效,是数据处理的常用技巧。

简单一句话区分:

  • map :对每个元素单独做操作(一对一转换)
  • reduce :把所有元素聚合成一个结果(多对一汇总)

一、map:批量处理每个元素

map(function, iterable)

  • 作用:把指定函数应用到可迭代对象(列表、元组等)的每一个元素
  • 返回:一个 map 对象(可转列表、元组等)

1. 基础示例

python 复制代码
# 需求:把列表中所有数字 ×2
nums = [1, 2, 3, 4]

# 定义处理函数
def double(x):
    return x * 2

# map 批量处理
result = map(double, nums)

# 转列表查看结果
print(list(result))  # 输出: [2, 4, 6, 8]

2. 搭配 lambda 简写(最常用)

实际开发中,简单函数直接用 lambda,不用单独定义:

python 复制代码
nums = [1, 2, 3, 4]
result = map(lambda x: x * 2, nums)
print(list(result))  # [2, 4, 6, 8]

3. 处理多个可迭代对象

map 可以同时处理多个列表,函数参数数量对应列表数量:

python 复制代码
a = [1, 2, 3]
b = [10, 20, 30]

# 对应位置相加
result = map(lambda x, y: x + y, a, b)
print(list(result))  # [11, 22, 33]

二、reduce:聚合所有元素为一个值

reduce(function, iterable[, initializer])

  • 作用:反复用函数处理前两个结果,最终把整个序列合并成一个值
  • 注意:Python3 中 reduce 不在内置函数里,需要从 functools 导入

1. 基础示例:列表求和

python 复制代码
# 必须先导入
from functools import reduce

nums = [1, 2, 3, 4]

# 累加函数:a=上一次结果,b=当前元素
def add(a, b):
    return a + b

# reduce 汇总求和
total = reduce(add, nums)
print(total)  # 输出: 1+2+3+4=10

2. 搭配 lambda 简写

python 复制代码
from functools import reduce

nums = [1, 2, 3, 4]
total = reduce(lambda a, b: a + b, nums)
print(total)  # 10

3. 带初始值的 reduce

指定初始值,会从初始值开始计算:

python 复制代码
from functools import reduce

nums = [1, 2, 3]
# 初始值=10,计算 10+1+2+3
total = reduce(lambda a,b: a+b, nums, 10)
print(total)  # 16

4. 其他常用场景:求最大值

python 复制代码
from functools import reduce

nums = [5, 2, 9, 1]
max_num = reduce(lambda a, b: a if a > b else b, nums)
print(max_num)  # 9

三、map + reduce 组合使用(经典实战)

先批量处理(map),再汇总结果(reduce),这是大数据处理的基础思想。

示例:先把所有数字平方,再求和

python 复制代码
from functools import reduce

nums = [1, 2, 3, 4]

# 1. map:每个数平方 → [1,4,9,16]
# 2. reduce:求和 → 1+4+9+16=30
result = reduce(lambda a,b: a+b, map(lambda x: x**2, nums))

print(result)  # 30

四、快速对比总结

函数 作用 输入 → 输出 特点
map 批量转换 多个元素 → 同数量元素 一对一处理
reduce 聚合汇总 多个元素 → 单个值 多对一汇总

核心记忆口诀

  • map:挨个做,不减少数量
  • reduce:往一起捏,只剩一个值

总结

  1. map 用于对序列中每个元素执行相同操作,返回新序列
  2. reduce 用于把序列所有元素合并成一个结果 ,需从 functools 导入
  3. 两者搭配 lambda 使用最简洁,是 Python 数据处理的高效写法
  4. 大数据中的 MapReduce 思想,就来源于这两个基础函数
相关推荐
ZhengEnCi15 小时前
M3-markconv库找不到wkhtmltopdf问题
python
2301_7644413318 小时前
LISA时空跃迁分析,地理时空分析
数据结构·python·算法
014-code18 小时前
订单超时取消与库存回滚的完整实现(延迟任务 + 状态机)
java·开发语言
lly20240618 小时前
组合模式(Composite Pattern)
开发语言
游乐码19 小时前
c#泛型约束
开发语言·c#
Dontla19 小时前
go语言Windows安装教程(安装go安装Golang安装)(GOPATH、Go Modules)
开发语言·windows·golang
chushiyunen19 小时前
python rest请求、requests
开发语言·python
cTz6FE7gA19 小时前
Python异步编程:从协程到Asyncio的底层揭秘
python
铁东博客19 小时前
Go实现周易大衍筮法三变取爻
开发语言·后端·golang
baidu_huihui19 小时前
在 CentOS 9 上安装 pip(Python 的包管理工具)
开发语言·python·pip