Python 中的collections 模块

huangfen2002 · 发表于 2018-8-9 07:15:17

　　这个模块中实现了一些类，非常灵活。可以用于替代python 内置的dict 、list 、tuple 、set 类型。并且一些功能是这些内置类型所不存在的。
　　在网络上找了一些资料,重点说说collections 模块中的 deque 、defaultdict、Counter 类
　　1、class deque
　　类似于python 内置的 list ，不过它是一个双向的list。可以在任意一头进行操作
　　help(collections.deque)
　　class deque(__builtin__.object)
　　deque([iterable[, maxlen]]) --> deque object
　　deque 的参数应该时一个iterable.
　　Example:
In [1]: import collections　　
In [2]: d = collections.deque('abcdef')
　　
In [3]: print d
　　
deque(['a', 'b', 'c', 'd', 'e', 'f'])
　　

　　
In [4]: d.append('mm')       #追加元素
　　
In [5]: print d
　　
deque(['a', 'b', 'c', 'd', 'e', 'f', 'mm'])
　　

　　
In [6]: d.appendleft('gg') #从左追加元素
　　
In [7]: print d
　　
deque(['gg', 'a', 'b', 'c', 'd', 'e', 'f', 'mm'])
　　

　　
In [8]: d.pop() # pop 一个元素
　　
Out[8]: 'mm'
　　
In [9]: print d
　　
deque(['gg', 'a', 'b', 'c', 'd', 'e', 'f'])
　　

　　
In [10]: d.popleft() #从左pop 一个元素
　　
Out[10]: 'gg'
　　
In [11]: print d
　　
deque(['a', 'b', 'c', 'd', 'e', 'f'])
　　

　　
In [12]: d.extend('xyz') #扩展
　　
In [13]: print d
　　
deque(['a', 'b', 'c', 'd', 'e', 'f', 'x', 'y', 'z'])
　　

　　
In [14]: d.extendleft('123')  #左扩展
　　
In [15]: print d
　　
deque(['3', '2', '1', 'a', 'b', 'c', 'd', 'e', 'f', 'x', 'y', 'z'])
　　

　　

　　
In [16]: d.reverse() #反转
　　
In [17]: print d
　　
deque(['z', 'y', 'x', 'f', 'e', 'd', 'c', 'b', 'a', '1', '2', '3'])
　　

　　

　　
In [22]: d.extend('1111')
　　
In [23]: d.count('1')    #统计一个元素的个数
　　
Out[23]: 5
　　
In [24]: print d
　　
deque(['z', 'y', 'x', 'f', 'e', 'd', 'c', 'b', 'a', '1', '2', '3', '1', '1', '1', '1'])
　　

　　
In [27]: d.rotate(2)  #右旋转
　　
In [28]: print d
　　
deque(['1', '1', 'z', 'y', 'x', 'f', 'e', 'd', 'c', 'b', 'a', '1', '2', '3', '1', '1'])
　　

　　
In [29]: d.rotate(-2) #左旋转
　　
In [30]: print d
　　
deque(['z', 'y', 'x', 'f', 'e', 'd', 'c', 'b', 'a', '1', '2', '3', '1', '1', '1', '1'])
　　

　　
In [31]: d.clear() #清空
　　
In [32]: print d
　　
deque([])
　　另外在deque 函数中发现一个maxlen参数。主要是限制这个双向list 的大小
In [34]: d = collections.deque(xrange(10),5)　　
In [35]: print d
　　
deque([5, 6, 7, 8, 9], maxlen=5)
　　
In [36]:
　　2、class defaultdict
　　python 内置的dict 类型有一个setdefault 方法，这个方法的意思是。获取一个dict 中key 对应的value 。若这个key 不存在于dict 中，则在这个dict 设置 key, 这个key 对应的 value 为 defaultdict 设置的相应值
　　Example:
In [46]: d = {'Name':'God','Age':28}　　
In [52]: d.setdefault('Name') # 这个key 存在于dict 中，因此返回了对应的value
　　
Out[52]: 'God'
　　

　　
In [48]: d.setdefault('test') # 这个key不存在于dict 中，因此它被set 到了dict中，没有指定value ，则value 为 None
　　

　　
In [49]: d
　　
Out[49]: {'Age': 28, 'Name': 'God', 'test': None}
　　

　　
In [50]: d.setdefault('test2','test2value')  # 这个key不存在于dict 中，因此它被set 到了dict中，指定value 为 "test2value"
　　
Out[50]: 'test2value'
　　

　　
In [51]: d
　　
Out[51]: {'Age': 28, 'Name': 'God', 'test': None, 'test2': 'test2value'}
　　而class defaultdict类似于dict 中的 setdefault函数. 只是它在初始化这个dict 的时候就已经设置了默认值.
　　Example:
#! /usr/bin/env python　　

　　
import collections
　　

　　
def default_factory():
　　
return "defualt value"
　　

　　
#在dict存在一个d['foo'] = 'bar' 的值。若获取不存在于dict中的key，
　　
#则返回default_factory 函数的返回值
　　
d = collections.defaultdict(default_factory,foo='bar')
　　
print 'd:',d
　　
print "foo=>",d.get('foo')
　　
print "foo=>",d['foo']
　　
print "var=>",d['bar']
　　

　　
print '*' * 20
　　
# 定义的这个dict,若key 不存在于dict 中，则将这个key放到dict中，
　　
# 并对这个key赋值为list
　　
d = collections.defaultdict(list)
　　
print 'd:',d
　　
print "foo=>",d.get('foo')
　　
print "foo=>",d['foo']
　　
print "var=>",d['bar']
　　执行结果如下:
d: defaultdict(<function default_factory at 0x7f230849e8c0>, {'foo': 'bar'})　　
foo=> bar
　　
foo=> bar
　　
var=> defualt value
　　
********************
　　
d: defaultdict(<type 'list'>, {})
　　
foo=> None
　　
foo=> []
　　
var=> []
　　3、class Counter
　　我感觉Counter 这个类比较牛，它接受一下几种类型的参数，并返回一个dict
　　>>> c = Counter()                         # a new, empty counter
　　>>> c = Counter('gallahad')                # a new counter from an iterable
　　>>> c = Counter({'a': 4, 'b': 2})          # a new counter from a mapping
　　>>> c = Counter(a=4, b=2)                # a new counter from keyword args
　　看看都时什么样的结果：
In [1]: import collections　　
In [2]: c = collections.Counter()
　　
In [3]: print c
　　
Counter()
　　

　　
In [4]: c = collections.Counter('abcdefg')
　　
In [5]: print c
　　
Counter({'a': 1, 'c': 1, 'b': 1, 'e': 1, 'd': 1, 'g': 1, 'f': 1})
　　

　　
In [6]: c = collections.Counter({'a': 4, 'b': 2})
　　
In [7]: print c
　　
Counter({'a': 4, 'b': 2})
　　

　　
In [8]: c = collections.Counter(a=4, b=2)
　　
In [9]: print c
　　
Counter({'a': 4, 'b': 2})
　　那么这个返回的dict 到底是一个什么样的结构呢? 用它自己的原话说是这样的
　　Elements are stored as dictionary keys and their counts are stored as dictionary values
　　以下通过它本身的几个实例来看具体的使用:
In [10]: c = collections.Counter('abcdeabcdabcaba')　　

　　
In [12]: print c
　　
Counter({'a': 5, 'b': 4, 'c': 3, 'd': 2, 'e': 1})
　　

　　
In [13]: c.most_common(3)  # 显示出个数最多的三个元素
　　
Out[13]: [('a', 5), ('b', 4), ('c', 3)]
　　

　　
In [14]: sorted(c)  # 过滤排重
　　
Out[14]: ['a', 'b', 'c', 'd', 'e']
　　

　　

　　
In [17]: d = collections.Counter('simsalabim')
　　
In [18]: c.update(d)  # 将d 这个counter 更新到c 中
　　
In [19]: print c
　　
Counter({'a': 7, 'b': 5, 'c': 3, 'd': 2, 'i': 2, 'm': 2, 's': 2, 'e': 1, 'l': 1})
　　总之，Counter 类所对应的实例，可以参考dict 的方法去操作。在上例中可以使用help(c) 去获得相应的帮助信息。
　　4、namedtuple
　　namedtuple 不是collections模块中的类，而是collections模块中的一个函数。获取帮助:
>>> from collections import namedtuple　　
>>>  help(namedtuple)
　　
namedtuple(typename, field_names, verbose=False)
　　
Returns a new subclass of tuple with named fields.
　　

　　
>>> Point = namedtuple('Point', 'x y')
　　
>>> Point.__doc__                # docstring for the new class
　　
'Point(x, y)'
　　
>>> p = Point(11, y=22)          # instantiate with positional args or keywords
　　
>>> p[0] + p[1]                   # indexable like a plain tuple
　　
33
　　
>>> x, y = p                      # unpack like a regular tuple
　　
>>> x, y
　　
(11, 22)
　　
>>> p.x + p.y                      # fields also accessable by name
　　
33
　　
>>> d = p._asdict()                # convert to a dictionary
　　
>>> d['x']
　　
11
　　
>>> Point(**d)                   # convert from a dictionary
　　
Point(x=11, y=22)
　　
>>> p._replace(x=100)             # _replace() is like str.replace() but targets named fields
　　
Point(x=100, y=22)
　　帮助信息中的所有实例都存在了。其中第一条就告诉了,通过namedtuple函数返回的是一个tuple的subclass
　　namedtuple 这个函数到底有什么好处呢? 举个例子来说吧。
　　假如要表示一个点的坐标，通常使用tuple (x,y)即可，但是单单的去写(x,y)除了自己明白外，其他人就不知道了。这是就是namedtuple出场的时候了 Point = namedtuple('Point','x,y') 。这样之后就存在了一个tuple 的 subclass ，且完全可以像tuple 一样的去使用。
　　5、OrderedDict
　　大家都知道，字典里面的内容是没有顺序的。但的确有时候我们希望字典里的东西能够按照key或者value的值排序后再输出来。这是可以使用OrderdDict 这个有顺序的字典了。
　　网络上摘录了一个普通字典和OrderedDict的比较实例：
import collections　　

　　
print 'Regular dictionary:'
　　
d={}
　　
d['a']='A'
　　
d['b']='B'
　　
d['c']='C'
　　
for k,v in d.items():
　　
print k,v
　　

　　
print '\nOrderedDict:'
　　
d=collections.OrderedDict()
　　
d['a']='A'
　　
d['b']='B'
　　
d['c']='C'
　　
for k,v in d.items():
　　
print k,v
　　相应输出结果：
Regular dictionary:　　
a A
　　
c C
　　
b B
　　

　　
OrderedDict:
　　
a A
　　
b B
　　
c C
　　由于OrderedDict 的顺序性，两个OrderedDict字典中，若内容相同，但顺序不同，将会被认作为两个字典。
import collections　　

　　
print 'Regular dictionary:'
　　
d1={}
　　
d1['a']='A'
　　
d1['b']='B'
　　
d1['c']='C'
　　

　　
d2={}
　　
d2['c']='C'
　　
d2['a']='A'
　　
d2['b']='B'
　　

　　
print d1==d2
　　

　　
print '\nOrderedDict:'
　　
d1=collections.OrderedDict()
　　
d1['a']='A'
　　
d1['b']='B'
　　
d1['c']='C'
　　

　　
d2=collections.OrderedDict()
　　
d2['c']='C'
　　
d2['a']='A'
　　
d2['b']='B'
　　

　　
print  d1==d2
　　输出结果：
Regular dictionary:　　
True
　　

　　
OrderedDict:
　　
False
　　现实的生产环境中，我有的也许就是一个普通的字典。但同样要按照key 或者 value 进行排序。如何处理呢?
d = collections.OrderedDict() //定义一个OrderedDict的字典　　
l=sorted(m.items(),key=lambda e:e[1],reverse=True)  //将普通的字典m，按照value值进行排序
　　
// 若 e[0] ,则按照key值进行排序
　　

　　
// 将排序好的普通字典的值，在存放到具有顺序的OrderedDict字典中
　　
for i in l:
　　
key,value=i
　　
d[key] = value
　　
print d

账号		自动登录	找回密码
密码			立即注册

大疆运维招人啦，

C++ :try 语句块和异常处理

C++的多态

Red Hat RHCE 8 (EX294) Cert Guide

Java/C++ 区别：看完这一篇，就够用！

别再用过时库了！这 13 个顶级 C++ 库才是

c++ size_t 和 int 的区别

[经验分享] Python 中的collections 模块

浏览过的版块

扫码加入运维网微信交流群