全网最适合入门的面向对象编程教程:42 Python 常用复合数据类型-collections 容器数据类型
摘要:
在 Python 中,collections 模块提供了一组高效、功能强大的容器数据类型,扩展了内置的基础数据类型(如 list、tuple、dict 等),这些容器数据类型在处理特定问题时,能够提供更简洁、更高效的解决方案。
原文链接:
往期推荐:
全网最适合入门的面向对象编程教程:00 面向对象设计方法导论
全网最适合入门的面向对象编程教程:01 面向对象编程的基本概念
全网最适合入门的面向对象编程教程:02 类和对象的 Python 实现-使用 Python 创建类
全网最适合入门的面向对象编程教程:03 类和对象的 Python 实现-为自定义类添加属性
全网最适合入门的面向对象编程教程:04 类和对象的Python实现-为自定义类添加方法
全网最适合入门的面向对象编程教程:05 类和对象的Python实现-PyCharm代码标签
全网最适合入门的面向对象编程教程:06 类和对象的Python实现-自定义类的数据封装
全网最适合入门的面向对象编程教程:07 类和对象的Python实现-类型注解
全网最适合入门的面向对象编程教程:08 类和对象的Python实现-@property装饰器
全网最适合入门的面向对象编程教程:09 类和对象的Python实现-类之间的关系
全网最适合入门的面向对象编程教程:10 类和对象的Python实现-类的继承和里氏替换原则
全网最适合入门的面向对象编程教程:11 类和对象的Python实现-子类调用父类方法
全网最适合入门的面向对象编程教程:12 类和对象的Python实现-Python使用logging模块输出程序运行日志
全网最适合入门的面向对象编程教程:13 类和对象的Python实现-可视化阅读代码神器Sourcetrail的安装使用
全网最适合入门的面向对象编程教程:全网最适合入门的面向对象编程教程:14 类和对象的Python实现-类的静态方法和类方法
全网最适合入门的面向对象编程教程:15 类和对象的 Python 实现-__slots__魔法方法
全网最适合入门的面向对象编程教程:16 类和对象的Python实现-多态、方法重写与开闭原则
全网最适合入门的面向对象编程教程:17 类和对象的Python实现-鸭子类型与"file-like object"
全网最适合入门的面向对象编程教程:18 类和对象的Python实现-多重继承与PyQtGraph串口数据绘制曲线图
全网最适合入门的面向对象编程教程:19 类和对象的 Python 实现-使用 PyCharm 自动生成文件注释和函数注释
全网最适合入门的面向对象编程教程:20 类和对象的Python实现-组合关系的实现与CSV文件保存
全网最适合入门的面向对象编程教程:21 类和对象的Python实现-多文件的组织:模块module和包package
全网最适合入门的面向对象编程教程:22 类和对象的Python实现-异常和语法错误
全网最适合入门的面向对象编程教程:23 类和对象的Python实现-抛出异常
全网最适合入门的面向对象编程教程:24 类和对象的Python实现-异常的捕获与处理
全网最适合入门的面向对象编程教程:25 类和对象的Python实现-Python判断输入数据类型
全网最适合入门的面向对象编程教程:26 类和对象的Python实现-上下文管理器和with语句
全网最适合入门的面向对象编程教程:27 类和对象的Python实现-Python中异常层级与自定义异常类的实现
全网最适合入门的面向对象编程教程:28 类和对象的Python实现-Python编程原则、哲学和规范大汇总
全网最适合入门的面向对象编程教程:29 类和对象的Python实现-断言与防御性编程和help函数的使用
全网最适合入门的面向对象编程教程:30 Python的内置数据类型-object根类
全网最适合入门的面向对象编程教程:31 Python的内置数据类型-对象Object和类型Type
全网最适合入门的面向对象编程教程:32 Python的内置数据类型-类Class和实例Instance
全网最适合入门的面向对象编程教程:33 Python的内置数据类型-对象Object和类型Type的关系
全网最适合入门的面向对象编程教程:34 Python的内置数据类型-Python常用复合数据类型:元组和命名元组
全网最适合入门的面向对象编程教程:35 Python的内置数据类型-文档字符串和__doc__属性
全网最适合入门的面向对象编程教程:36 Python的内置数据类型-字典
全网最适合入门的面向对象编程教程:37 Python常用复合数据类型-列表和列表推导式
全网最适合入门的面向对象编程教程:38 Python常用复合数据类型-使用列表实现堆栈、队列和双端队列
全网最适合入门的面向对象编程教程:39 Python常用复合数据类型-集合
全网最适合入门的面向对象编程教程:40 Python常用复合数据类型-枚举和enum模块的使用
全网最适合入门的面向对象编程教程:41 Python常用复合数据类型-队列(FIFO、LIFO、优先级队列、双端队列和环形队列)
更多精彩内容可看:
给你的 Python 加加速:一文速通 Python 并行计算
一个MicroPython的开源项目集锦:awesome-micropython,包含各个方面的Micropython工具库
Avnet ZUBoard 1CG开发板---深度学习新选择
SenseCraft 部署模型到Grove Vision AI V2图像处理模块
文档和代码获取:
可访问如下链接进行对文档下载:
https://github.com/leezisheng/Doc
本文档主要介绍如何使用 Python 进行面向对象编程,需要读者对 Python 语法和单片机开发具有基本了解。相比其他讲解 Python 面向对象编程的博客或书籍而言,本文档更加详细、侧重于嵌入式上位机应用,以上位机和下位机的常见串口数据收发、数据处理、动态图绘制等为应用实例,同时使用 Sourcetrail 代码软件对代码进行可视化阅读便于读者理解。
相关示例代码获取链接如下: https://github.com/leezisheng/Python-OOP-Demo
正文
Python 内置的数据类型和方法,collections 模块在这些内置类型的基础提供了额外的高性能数据类型,比如基础的字典是不支持顺序的,collections 模块的 OrderedDict 类构建的字典可以支持顺序,collections 模块的这些扩展的类用处非常大,熟练掌握该模块,可以大大简化 Python 代码,提高 Python 代码逼格和运行效率。
其中,命名元组 namedtuple
和双端队列 deque
在前面的文章中,我们已经提及,我们对其他的数据类型进行讲解。
Counter 计数字典子类
Counter
是一个用于计数的字典子类,主要用于统计可哈希对象的出现次数。它支持常见的计数操作,如最常见的元素、总计数等,最常见的应用便是文本处理中的词频统计。
python
from collections import Counter
# 统计字符串中每个字符的出现次数
c = Counter('abracadabra')
print(c) # Counter({'a': 5, 'b': 2, 'r': 2, 'c': 1, 'd': 1})
# 统计列表中元素的出现次数
c = Counter(['apple', 'banana', 'apple', 'orange', 'banana', 'apple'])
print(c) # Counter({'apple': 3, 'banana': 2, 'orange': 1})
# 获取最常见的元素
print(c.most_common(1)) # [('apple', 3)]
# 更新计数
c.update(['apple', 'kiwi'])
print(c) # Counter({'apple': 4, 'banana': 2, 'orange': 1, 'kiwi': 1})
# 减少计数
c.subtract(['banana', 'orange'])
print(c) # Counter({'apple': 4, 'banana': 1, 'kiwi': 1, 'orange': 0})
OrderedDict 有序字典
OrderedDict
是一个字典子类,记录元素的插入顺序。自 Python 3.7 起,内置字典也保持插入顺序,但 OrderedDict
仍提供一些额外的方法,如 move_to_end
等方法来调整元素位置。
python
from collections import OrderedDict
# 创建一个OrderedDict
od = OrderedDict()
od['a'] = 1
od['b'] = 2
od['c'] = 3
print(od) # OrderedDict([('a', 1), ('b', 2), ('c', 3)])
# 移动元素到末尾
od.move_to_end('a')
print(od) # OrderedDict([('b', 2), ('c', 3), ('a', 1)])
# 移动元素到开头
od.move_to_end('c', last=False)
print(od) # OrderedDict([('c', 3), ('b', 2), ('a', 1)])
defaultdict 默认值字典
defaultdict
是一个字典子类,提供了默认值机制。当访问不存在的键时,会自动创建一个默认值,而不是抛出 KeyError
。
python
from collections import defaultdict
# 使用list作为默认工厂
dd = defaultdict(list)
dd['fruits'].append('apple')
dd['fruits'].append('banana')
print(dd) # defaultdict(<class 'list'>, {'fruits': ['apple', 'banana']})
# 使用int作为默认工厂(适用于计数)
dd = defaultdict(int)
dd['apples'] += 1
dd['oranges'] += 2
print(dd) # defaultdict(<class 'int'>, {'apples': 1, 'oranges': 2})
# 使用lambda自定义默认值
dd = defaultdict(lambda: 'unknown')
print(dd['name']) # 输出: 'unknown'
ChainMap 映射链
ChainMap
是一个用于将多个字典或映射视为一个单一映射的类。它维护了一个字典列表,并在查找时按顺序搜索这些字典。它可以将多个字典合并为一个逻辑映射,同时修改 ChainMap
中的任何一个字典都会反映在整个映射中,并且可以控制查找时字典的优先级。常用于配置管理,将多个配置字典合并为一个配置映射,或实现作用域嵌套,如变量解析时查找局部和全局作用域。
python
from collections import ChainMap
dict1 = {'a': 1, 'b': 2}
dict2 = {'b': 3, 'c': 4}
dict3 = {'c': 5, 'd': 6}
# 创建ChainMap
cm = ChainMap(dict1, dict2, dict3)
print(cm) # ChainMap({'a': 1, 'b': 2}, {'b': 3, 'c': 4}, {'c': 5, 'd': 6})
# 查找键
print(cm['a']) # 输出: 1
print(cm['b']) # 输出: 2 (来自dict1)
print(cm['c']) # 输出: 4 (来自dict2)
# 添加新键
cm['e'] = 7
print(dict1) # {'a': 1, 'b': 2, 'e': 7}
# 更新优先级
cm = cm.new_child(dict3)
print(cm) # ChainMap({'c': 5, 'd': 6}, {'a': 1, 'b': 2, 'e': 7}, {'b': 3, 'c': 4}, {'c': 5, 'd': 6})
自定义字典、列表和字符串的基类
UserDict
、UserList
和 UserString
是为用户创建自定义字典、列表和字符串提供的基类。它们通过封装内置数据类型,使得继承和扩展更加简单和安全。它们提供了可以继承和重写的方法,简化自定义容器的实现;并且内部使用一个独立的存储结构,避免直接修改内置类型的行为。常用于实现特定行为的容器,如自动转换键、限制元素类型等。
python
from collections import UserDict, UserList, UserString
# 自定义字典,所有键转换为小写
class MyDict(UserDict):
def __setitem__(self, key, value):
super().__setitem__(key.lower(), value)
md = MyDict()
md['A'] = 1
print(md) # {'a': 1}
# 自定义列表,限制只能添加整数
class MyList(UserList):
def append(self, item):
if isinstance(item, int):
super().append(item)
else:
raise TypeError('Only integers are allowed')
ml = MyList()
ml.append(1)
print(ml) # [1]
# ml.append('a') # 会抛出TypeError
# 自定义字符串,所有字符大写
class MyString(UserString):
def upper(self):
return MyString(self.data.upper())
ms = MyString('hello')
print(ms.upper()) # 'HELLO'