6.4 collections 容器数据类型 - 服务器托管|北京服务器租用|机房托管租用|IDC托管租用|机房机柜带宽租用-价格及费用咨询

在本节中，我们将详细介绍 Python 中的 collections 模块。作为 Python 标准库的一部分，collections 提供了一些有用的容器数据类型，它们可以帮助我们在编程时更加高效地处理数据。我们将逐一介绍这些容器数据类型，并通过实例代码来加深理解。请注意，这里的内容针对 Python 3.x 版本。

collections 模块主要包括以下几种数据类型：

namedtuple
deque
Counter
OrderedDict
defaultdict
ChainMap

接下来，我们将分别介绍这些数据类型的用途和用法。

1. `namedtuple`

namedtuple 是一个工厂函数，它可以帮助我们创建一个简单的自定义类。这个类具有不可变性（即创建后不能修改），并且可以通过属性名来访问元素。namedtuple 对于需要定义简单数据结构的场景非常有用。

from collections import namedtuple

# 定义一个简单的坐标类
Coord = namedtuple("Coord", ["x", "y"])

coord1 = Coord(3, 4)
print(coord1.x)  # 输出：3
print(coord1.y)  # 输出：4

2. `deque`

deque 是一个双端队列（double-ended queue）数据结构，它允许我们在队列的两端进行插入和删除。相比于 Python 的内置 list，deque 在头部插入和删除元素时的性能更优。

from collections import deque

d = deque([1, 2, 3, 4, 5])
d.appendleft(0)  # 在队列头部插入元素
d.append(6)       # 在队列尾部插入元素
print(d)          # 输出：deque([0, 1, 2, 3, 4, 5, 6])

d.popleft()       # 删除队列头部的元素
d.pop()           # 删除队列尾部的元素
print(d)          # 输出：deque([1, 2, 3, 4, 5])

3. `Counter`

Counter 是一个字典（Dict）的子类，用于计数可哈希的对象。它可以方便地对数据进行计数统计。

from collections import Counter

data = ['apple', 'banana', 'orange', 'apple', 'banana', 'apple']
counter = Counter(data)
print(counter)    # 输出：Counter({'apple': 3, 'banana': 2, 'orange': 1})

4. `OrderedDict`

OrderedDict 是一个字典（Dict）的子类，它会维护键值对的插入顺序。在 Python 3.7 之前，内置的字典类型不保证顺序，但从 Python 3.7 开始，内置字典已经变为有序，因此 OrderedDict 在某种程度上已经不再是必需的。

from collections import OrderedDict

od = OrderedDict()
od["a"] = 1
od["b"] = 2
od["c"] = 3

for key, value in od.items():
    print(key, value)
# 输出：
# a 1
# b 2
# c 3

5. `defaultdict`

defaultdict 是一个字典（Dict）的子类，它提供了一个默认值工厂方法，用于处理不存在的键。这在某些场景下可以简化代码逻辑。

from collections import defaultdict

dd = defaultdict(int)
data = ['apple', 'banana', 'orange', 'apple', 'banana', 'apple']

for item in data:
    dd[item] += 1

print(dd)  # 输出：defaultdict(, {'apple': 3, 'banana': 2, 'orange': 1})

6. `ChainMap`

ChainMap 是一个类，用于将多个映射（如字典）组合在一起。在查找时，它会按照添加的顺序从第一个映射开始，直到找到相应的键。这在合并多个配置或参数字典时非常有用。

from collections import ChainMap

dict1 = {"a": 1, "b": 2}
dict2 = {"b": 3, "c": 4}

chain_map = ChainMap(dict1, dict2)
print(chain_map["a"])  # 输出：1
print(chain_map["b"])  # 输出：2，因为在 dict1 中找到了 "b"
print(chain_map["c"])  # 输出：4

现在，您应该对 Python collections 模块的各种容器数据类型有了一个基本的了解。这些数据类型旨在简化编程任务，提高代码可读性和性能。在实际编程过程中，您可以根据需要选择使用这些容器数据类型。
推荐阅读：

https://mp.weixin.qq.com/s/dV2JzXfgjDdCmWRmE0glDA

https://mp.weixin.qq.com/s/an83QZOWXHqll3SGPYTL5g

服务器托管，北京服务器托管，服务器租用 http://www.fwqtg.net

相关推荐: 通过 HTTP/2 协议案例学习 Java & Netty 性能调优：工具、技巧与方法论

作者：梁倍宁 Apache Dubbo Contributor、陈有为 Apache Dubbo PMC 摘要 Dubbo3 Triple 协议是参考 gRPC、gRPC-Web、Dubbo2 等协议特点设计而来，它吸取各自协议特点，完全兼容 gRPC、Str…

1. namedtuple

2. deque

3. Counter

4. OrderedDict

5. defaultdict

6. ChainMap

服务器托管，北京服务器托管，服务器租用，机房机柜带宽租用