Python的defaultdict详解

Python的defaultdict详解

  • [什么是 defaultdict](#什么是 defaultdict)
    • [导入与创建 defaultdict](#导入与创建 defaultdict)
  • [defaultdict 的常见用法](#defaultdict 的常见用法)

什么是 defaultdict

defaultdict 是 Python 中 collections 模块下的一个类 ,它继承自内置的 dict,并扩展了默认值的功能。当访问不存在的键时,defaultdict 可以自动为这个键生成一个默认值,而不会抛出 KeyError 异常。

导入与创建 defaultdict

在使用 defaultdict 之前,需要从 collections 模块导入它:

python 复制代码
from collections import defaultdict

defaultdict 的创建需要提供一个工厂函数,这个工厂函数会在访问不存在的键时被调用来生成默认值。最常用的工厂函数是 int(用于计数器)、list(用于存储多个值)和 set(用于存储唯一值)。

python 复制代码
# 创建一个默认值为 0 的 defaultdict
dd = defaultdict(int)

# 当访问不存在的键时,会自动生成默认值
print(dd["key"])  # 输出: 0

defaultdict 的常见用法

计数器

假设我们需要统计一个字符串中每个字符出现的次数。使用普通字典时,我们通常需要检查键是否存在,然后再决定是增加计数还是初始化为 1。而使用 defaultdict,这一操作变得简单许多。

python 复制代码
from collections import defaultdict

text = "hello world"
char_count = defaultdict(int)

for char in text:
    char_count[char] += 1

print(char_count)  # 输出: defaultdict(<class 'int'>, {'h': 1, 'e': 1, 'l': 3, 'o': 2, ' ': 1, 'w': 1, 'r': 1, 'd': 1})

分组数据

假设有一组数据,想要根据某个特征对它们进行分组。使用 list 作为默认值,可以轻松实现这一功能。

python 复制代码
data = [("apple", "fruit"), ("carrot", "vegetable"), ("banana", "fruit"), ("spinach", "vegetable")]

grouped_data = defaultdict(list)

for item, category in data:
    grouped_data[category].append(item)

print(grouped_data)  # 输出: defaultdict(<class 'list'>, {'fruit': ['apple', 'banana'], 'vegetable': ['carrot', 'spinach']})

集合去重

在某些情况下,需要将值按某个特征分类,但确保每个分类中不包含重复元素。这时可以使用 set 作为默认值。

python 复制代码
data = [("apple", "fruit"), ("banana", "fruit"), ("apple", "fruit"), ("carrot", "vegetable")]

unique_items = defaultdict(set)

for item, category in data:
    unique_items[category].add(item)

print(unique_items)  # 输出: defaultdict(<class 'set'>, {'fruit': {'banana', 'apple'}, 'vegetable': {'carrot'}})

defaultdict 与普通字典的区别

defaultdict 和普通字典在大多数操作上类似,但它们有一个关键区别:默认值的生成

  • 普通字典:访问一个不存在的键时,会抛出 KeyError 异常。我们需要显式检查键是否存在,或者使用 dict.get()方法提供一个默认值。

    python 复制代码
    d = {}
    print(d.get("key", 0))  # 输出: 0
  • defaultdict:访问不存在的键时,不会抛出异常,而是自动调用工厂函数生成一个默认值。

    python 复制代码
    dd = defaultdict(int)
    print(dd["key"])  # 输出: 0

此外,defaultdict 在初始化时需要指定一个工厂函数,而普通字典则不需要。

相关推荐
懒大王爱吃狼18 分钟前
Python绘制数据地图-MovingPandas
开发语言·python·信息可视化·python基础·python学习
laimaxgg20 分钟前
Linux关于华为云开放端口号后连接失败问题解决
linux·运维·服务器·网络·tcp/ip·华为云
数据小小爬虫21 分钟前
如何使用Python爬虫按关键字搜索AliExpress商品:代码示例与实践指南
开发语言·爬虫·python
martian66544 分钟前
第17篇:python进阶:详解数据分析与处理
开发语言·python
无码不欢的我1 小时前
使用vscode在本地和远程服务器端运行和调试Python程序的方法总结
ide·vscode·python
五味香1 小时前
Java学习,查找List最大最小值
android·java·开发语言·python·学习·golang·kotlin
金融OG1 小时前
99.8 金融难点通俗解释:净资产收益率(ROE)
大数据·python·线性代数·机器学习·数学建模·金融·矩阵
卷卷的小趴菜学编程1 小时前
c++之List容器的模拟实现
服务器·c语言·开发语言·数据结构·c++·算法·list
艾杰Hydra1 小时前
LInux配置PXE 服务器
linux·运维·服务器
多恩Stone1 小时前
【ubuntu 连接显示器无法显示】可以通过 ssh 连接 ubuntu 服务器正常使用,但服务器连接显示器没有输出
服务器·ubuntu·计算机外设