深入探究Python Collections模块:高效数据结构解决方案

前言

这几天刷leetcode题时,看到题解中有这样一行代码collections.defaultdict(list),不明白是啥意思,平时开发的脚本中未遇到,借着这个机会,学习一下collections模块的用法。

collections

这个模块实现了一些专门化的容器,提供了对 Python 的通用内建容器 dictlistsettuple 的补充。

defaultdict

defaultdictdict(字典)的一个子类,它为字典操作中的缺失键提供了默认值。这在处理计数、分组等操作时非常有用。

案例:给定一个列表,将每个单词按首字母分组

css 复制代码
import collections
​
mp = collections.defaultdict(list)
​
words = ['apple', 'banana', 'orange', 'pear', 'peach']
for word in words:
    mp[word[0]].append(word)
​
print(mp) # defaultdict(<class 'list'>, {'a': ['apple'], 'b': ['banana'], 'o': ['orange'], 'p': ['pear', 'peach']})

mp = collections.defaultdict(list)这行代码创建了一个defaultdict对象,其中list是指定的默认值类型。

这意味着当我们通过mp访问一个不存在的键时,defaultdict会自动创建这个键,并将其对应的值初始化为一个空列表。比如上面这段代码,我们在print(mp)前面增加mp['aa'],此时会输出defaultdict(<class 'list'>, {'a': ['apple'], 'b': ['banana'], 'o': ['orange'], 'p': ['pear', 'peach'], 'aa': []})

Counter

Counter是一个简单而强大的计数器工具,用于统计可迭代对象中各元素出现的次数。

案例:统计一个字符串中字符出现的次数

go 复制代码
import collections
​
s = "abracadabra"
counter = collections.Counter(s)
print(counter) # 输出结果:Counter({'a': 5, 'b': 2, 'r': 2, 'c': 1, 'd': 1})

namedtuple

namedtuple创建了一个带字段名的元组类型,它可以对元组进行命名,使得代码更易读。

案例:创建一个表示坐标的数据结构

ini 复制代码
import collections
​
Point = collections.namedtuple('Point', ['x', 'y'])
p = Point(11, y=22)
print(p.x, p.y) # 输出结果:11 22

deque

deque是一个双向队列,可以在两端快速插入和删除元素,适用于需要高效地进行队列和栈操作的场景。

案例:使用deque实现一个简单的循环队列

scss 复制代码
import collections
​
q = collections.deque(maxlen=3)
q.append(1)
q.append(2)
q.append(3)
print(q)  # 输出结果:deque([1, 2, 3], maxlen=3)
q.append(4)
print(q)  # 输出结果:deque([2, 3, 4], maxlen=3)

OrderedDict

有序字典,保持元素被插入的顺序。

案例:实现LRU缓存:LRU(Least Recently Used)缓存是一种常见的缓存策略,当缓存满时,会淘汰最近最少使用的元素。OrderedDict可以很方便地实现LRU缓存,每次访问一个元素时,将其移到字典的末尾,这样最近访问的元素就会被保留,最早访问的元素就会被淘汰。

python 复制代码
from collections import OrderedDict
​
class LRUCache:
    def __init__(self, capacity):
        self.capacity = capacity
        self.cache = OrderedDict()
​
    def get(self, key):
        if key in self.cache:
            value = self.cache[key]
            # 将访问的元素移到字典的末尾
            self.cache.move_to_end(key)
            return value
        else:
            return -1
​
    def put(self, key, value):
        if key in self.cache:
            # 如果key已经存在,将其移到字典的末尾
            self.cache.move_to_end(key)
        self.cache[key] = value
        if len(self.cache) > self.capacity:
            # 如果缓存已满,淘汰最早访问的元素
            self.cache.popitem(last=False)
​

ChainMap

在多个字典中查找某个键的值,可以使用ChainMap将这些字典组合成一个逻辑上的字典,从而方便地进行查找操作。

案例:使用ChainMap查找键的值:

ini 复制代码
from collections import ChainMap
​
dict1 = {'a': 1, 'b': 2}
dict2 = {'c': 3, 'd': 4}
dict3 = {'e': 5, 'f': 6}
​
chain_map = ChainMap(dict1, dict2, dict3)
​
value = chain_map['a']
print(value)  # 输出: 1
​
value = chain_map['c']
print(value)  # 输出: 3

UserDict

当需要创建一个自定义的字典类时,可以继承UserDict类,从而方便地实现自定义的字典功能。

案例:使用UserDict创建自定义字典类

css 复制代码
from collections import UserDict
​
class MyDict(UserDict):
    def __setitem__(self, key, value):
        super().__setitem__(key, value * 2)
​
my_dict = MyDict()
my_dict['a'] = 1
my_dict['b'] = 2
​
print(my_dict)  # 输出: {'a': 2, 'b': 4}

UserList

当需要创建一个自定义的列表类时,可以继承UserList类,从而方便地实现自定义的列表功能。

案例:使用UserList创建自定义列表类

python 复制代码
from collections import UserList
​
class MyList(UserList):
    def remove_duplicates(self):
        self.data = list(set(self.data))
​
my_list = MyList([1, 2, 2, 3, 4, 4, 5])
my_list.remove_duplicates()
​
print(my_list)  # 输出: [1, 2, 3, 4, 5]

UserString

当需要创建一个自定义的字符串类时,可以继承UserString类,从而方便地实现自定义的字符串功能。

案例:使用UserString创建自定义字符串类

python 复制代码
from collections import UserString
​
class MyString(UserString):
    def remove_whitespace(self):
        self.data = self.data.replace(' ', '')
​
my_string = MyString('Hello World')
my_string.remove_whitespace()
​
print(my_string)  # 输出: HelloWorld

最后

这篇文章主要介绍了collections模块中几个常用数据结构的简单介绍和示例。使用这些数据结构能够让我们更加高效地处理各种实际问题,提高代码的可读性和可维护性。

相关推荐
一点媛艺3 小时前
Kotlin函数由易到难
开发语言·python·kotlin
魔道不误砍柴功4 小时前
Java 中如何巧妙应用 Function 让方法复用性更强
java·开发语言·python
NiNg_1_2344 小时前
SpringBoot整合SpringSecurity实现密码加密解密、登录认证退出功能
java·spring boot·后端
_.Switch4 小时前
高级Python自动化运维:容器安全与网络策略的深度解析
运维·网络·python·安全·自动化·devops
Chrikk5 小时前
Go-性能调优实战案例
开发语言·后端·golang
幼儿园老大*5 小时前
Go的环境搭建以及GoLand安装教程
开发语言·经验分享·后端·golang·go
canyuemanyue5 小时前
go语言连续监控事件并回调处理
开发语言·后端·golang
杜杜的man5 小时前
【go从零单排】go语言中的指针
开发语言·后端·golang
测开小菜鸟5 小时前
使用python向钉钉群聊发送消息
java·python·钉钉
萧鼎7 小时前
Python并发编程库:Asyncio的异步编程实战
开发语言·数据库·python·异步