设为首页 收藏本站
查看: 792|回复: 0

[经验分享] Python 中的collections 模块

[复制链接]

尚未签到

发表于 2018-8-9 07:15:17 | 显示全部楼层 |阅读模式
  这个模块中实现了一些类,非常灵活。可以用于替代python 内置的dict 、list 、tuple 、set 类型。并且一些功能是这些内置类型所不存在的。
  在网络上找了一些资料,重点说说collections 模块中的 deque 、defaultdict、Counter 类
  1、class deque
  类似于python 内置的 list ,不过它是一个双向的list。可以在任意一头进行操作
  help(collections.deque)
  class deque(__builtin__.object)
  deque([iterable[, maxlen]]) --> deque object
  deque 的参数应该时一个iterable.
  Example:
In [1]: import collections  
In [2]: d = collections.deque('abcdef')
  
In [3]: print d
  
deque(['a', 'b', 'c', 'd', 'e', 'f'])
  

  
In [4]: d.append('mm')         #追加元素
  
In [5]: print d
  
deque(['a', 'b', 'c', 'd', 'e', 'f', 'mm'])
  

  
In [6]: d.appendleft('gg')   #从左追加元素
  
In [7]: print d
  
deque(['gg', 'a', 'b', 'c', 'd', 'e', 'f', 'mm'])
  

  
In [8]: d.pop()    # pop 一个元素
  
Out[8]: 'mm'
  
In [9]: print d
  
deque(['gg', 'a', 'b', 'c', 'd', 'e', 'f'])
  

  
In [10]: d.popleft() #从左pop 一个元素
  
Out[10]: 'gg'
  
In [11]: print d
  
deque(['a', 'b', 'c', 'd', 'e', 'f'])
  

  
In [12]: d.extend('xyz')   #扩展
  
In [13]: print d
  
deque(['a', 'b', 'c', 'd', 'e', 'f', 'x', 'y', 'z'])
  

  
In [14]: d.extendleft('123')  #左扩展
  
In [15]: print d
  
deque(['3', '2', '1', 'a', 'b', 'c', 'd', 'e', 'f', 'x', 'y', 'z'])
  

  

  
In [16]: d.reverse() #反转
  
In [17]: print d
  
deque(['z', 'y', 'x', 'f', 'e', 'd', 'c', 'b', 'a', '1', '2', '3'])
  

  

  
In [22]: d.extend('1111')
  
In [23]: d.count('1')      #统计一个元素的个数
  
Out[23]: 5
  
In [24]: print d
  
deque(['z', 'y', 'x', 'f', 'e', 'd', 'c', 'b', 'a', '1', '2', '3', '1', '1', '1', '1'])
  

  
In [27]: d.rotate(2)  #右旋转
  
In [28]: print d
  
deque(['1', '1', 'z', 'y', 'x', 'f', 'e', 'd', 'c', 'b', 'a', '1', '2', '3', '1', '1'])
  

  
In [29]: d.rotate(-2) #左旋转
  
In [30]: print d
  
deque(['z', 'y', 'x', 'f', 'e', 'd', 'c', 'b', 'a', '1', '2', '3', '1', '1', '1', '1'])
  

  
In [31]: d.clear() #清空
  
In [32]: print d
  
deque([])
  另外在deque 函数中发现一个maxlen参数。主要是限制这个双向list 的 大小
In [34]: d = collections.deque(xrange(10),5)  
In [35]: print d
  
deque([5, 6, 7, 8, 9], maxlen=5)
  
In [36]:
  2、class defaultdict
  python 内置的dict 类型有一个setdefault 方法,这个方法的意思是。获取一个dict 中key 对应的value 。若这个key 不存在于dict 中,则在这个dict 设置 key, 这个key 对应的 value 为 defaultdict 设置的相应值
  Example:
In [46]: d = {'Name':'God','Age':28}  
In [52]: d.setdefault('Name')   # 这个key 存在于dict 中,因此返回了对应的value
  
Out[52]: 'God'
  

  
In [48]: d.setdefault('test')   # 这个key不存在于dict 中,因此它被set 到了dict中,没有指定value ,则value 为 None
  

  
In [49]: d
  
Out[49]: {'Age': 28, 'Name': 'God', 'test': None}
  

  
In [50]: d.setdefault('test2','test2value')  # 这个key不存在于dict 中,因此它被set 到了dict中,指定value 为 "test2value"
  
Out[50]: 'test2value'
  

  
In [51]: d
  
Out[51]: {'Age': 28, 'Name': 'God', 'test': None, 'test2': 'test2value'}
  而class defaultdict类似于dict 中的 setdefault函数. 只是它在初始化这个dict 的时候就已经设置了默认值.
  Example:
#! /usr/bin/env python  

  
import collections
  

  
def default_factory():
  
    return "defualt value"
  

  
#在dict存在一个d['foo'] = 'bar' 的值。若获取不存在于dict中的key,
  
#则返回default_factory 函数的返回值
  
d = collections.defaultdict(default_factory,foo='bar')
  
print 'd:',d
  
print "foo=>",d.get('foo')
  
print "foo=>",d['foo']
  
print "var=>",d['bar']
  

  
print '*' * 20
  
# 定义的这个dict,若key 不存在于dict 中,则将这个key放到dict中,
  
# 并对这个key赋值为list
  
d = collections.defaultdict(list)
  
print 'd:',d
  
print "foo=>",d.get('foo')
  
print "foo=>",d['foo']
  
print "var=>",d['bar']
  执行结果如下:
d: defaultdict(<function default_factory at 0x7f230849e8c0>, {'foo': 'bar'})  
foo=> bar
  
foo=> bar
  
var=> defualt value
  
********************
  
d: defaultdict(<type 'list'>, {})
  
foo=> None
  
foo=> []
  
var=> []
  3、class Counter
  我感觉Counter 这个类比较牛,它接受一下几种类型的参数,并返回一个dict
  >>> c = Counter()                           # a new, empty counter
  >>> c = Counter('gallahad')                 # a new counter from an iterable
  >>> c = Counter({'a': 4, 'b': 2})           # a new counter from a mapping
  >>> c = Counter(a=4, b=2)                   # a new counter from keyword args
  看看都时什么样的结果:
In [1]: import collections  
In [2]: c = collections.Counter()
  
In [3]: print c
  
Counter()
  

  
In [4]: c = collections.Counter('abcdefg')
  
In [5]: print c
  
Counter({'a': 1, 'c': 1, 'b': 1, 'e': 1, 'd': 1, 'g': 1, 'f': 1})
  

  
In [6]: c = collections.Counter({'a': 4, 'b': 2})
  
In [7]: print c
  
Counter({'a': 4, 'b': 2})
  

  
In [8]: c = collections.Counter(a=4, b=2)
  
In [9]: print c
  
Counter({'a': 4, 'b': 2})
  那么这个返回的dict 到底是一个什么样的结构呢? 用它自己的原话说是这样的
  Elements are stored as dictionary keys and their counts are stored as dictionary values
  以下通过它本身的几个实例来看具体的使用:
In [10]: c = collections.Counter('abcdeabcdabcaba')  

  
In [12]: print c
  
Counter({'a': 5, 'b': 4, 'c': 3, 'd': 2, 'e': 1})
  

  
In [13]: c.most_common(3)  # 显示出个数最多的三个元素
  
Out[13]: [('a', 5), ('b', 4), ('c', 3)]
  

  
In [14]: sorted(c)  # 过滤排重
  
Out[14]: ['a', 'b', 'c', 'd', 'e']
  

  

  
In [17]: d = collections.Counter('simsalabim')
  
In [18]: c.update(d)  # 将d 这个counter 更新到c 中
  
In [19]: print c
  
Counter({'a': 7, 'b': 5, 'c': 3, 'd': 2, 'i': 2, 'm': 2, 's': 2, 'e': 1, 'l': 1})
  总之,Counter 类 所对应的实例,可以参考dict 的方法去操作。在上例中可以使用help(c) 去获得相应的帮助信息。
  4、namedtuple
  namedtuple 不是collections模块中的类,而是collections模块中的一个函数。获取帮助:
>>> from collections import namedtuple  
>>>  help(namedtuple)
  
namedtuple(typename, field_names, verbose=False)
  
    Returns a new subclass of tuple with named fields.
  

  
    >>> Point = namedtuple('Point', 'x y')
  
    >>> Point.__doc__                   # docstring for the new class
  
    'Point(x, y)'
  
    >>> p = Point(11, y=22)             # instantiate with positional args or keywords
  
    >>> p[0] + p[1]                     # indexable like a plain tuple
  
    33
  
    >>> x, y = p                        # unpack like a regular tuple
  
    >>> x, y
  
    (11, 22)
  
    >>> p.x + p.y                       # fields also accessable by name
  
    33
  
    >>> d = p._asdict()                 # convert to a dictionary
  
    >>> d['x']
  
    11
  
    >>> Point(**d)                      # convert from a dictionary
  
    Point(x=11, y=22)
  
    >>> p._replace(x=100)               # _replace() is like str.replace() but targets named fields
  
    Point(x=100, y=22)
  帮助信息中的所有实例都存在了。其中第一条就告诉了,通过namedtuple函数返回的是一个tuple的subclass
  namedtuple 这个函数到底有什么好处呢? 举个例子来说吧。
  假如要表示一个点的坐标,通常使用tuple (x,y)即可,但是单单的去写(x,y)除了自己明白外,其他人就不知道了。这是就是namedtuple出场的时候了 Point = namedtuple('Point','x,y') 。这样之后就存在了一个tuple 的 subclass ,且完全可以像tuple 一样的去使用。
  5、OrderedDict
  大家都知道,字典里面的内容是没有顺序的。但的确有时候我们希望字典里的东西能够按照key或者value的值排序后再输出来。这是可以使用OrderdDict 这个有顺序的字典了。
  网络上摘录了一个普通字典和OrderedDict的比较实例:
import collections  

  
print 'Regular dictionary:'
  
d={}
  
d['a']='A'
  
d['b']='B'
  
d['c']='C'
  
for k,v in d.items():
  
    print k,v
  

  
print '\nOrderedDict:'
  
d=collections.OrderedDict()
  
d['a']='A'
  
d['b']='B'
  
d['c']='C'
  
for k,v in d.items():
  
    print k,v
  相应输出结果:
Regular dictionary:  
a A
  
c C
  
b B
  

  
OrderedDict:
  
a A
  
b B
  
c C
  由于OrderedDict 的顺序性,两个OrderedDict字典中,若内容相同,但顺序不同,将会被认作为两个字典。
import collections  

  
print 'Regular dictionary:'
  
d1={}
  
d1['a']='A'
  
d1['b']='B'
  
d1['c']='C'
  

  
d2={}
  
d2['c']='C'
  
d2['a']='A'
  
d2['b']='B'
  

  
print d1==d2
  

  
print '\nOrderedDict:'
  
d1=collections.OrderedDict()
  
d1['a']='A'
  
d1['b']='B'
  
d1['c']='C'
  

  
d2=collections.OrderedDict()
  
d2['c']='C'
  
d2['a']='A'
  
d2['b']='B'
  

  
print  d1==d2
  输出结果:
Regular dictionary:  
True
  

  
OrderedDict:
  
False
  现实的生产环境中,我有的也许就是一个普通的字典。但同样要按照key 或者 value 进行排序。如何处理呢?
d = collections.OrderedDict()    //定义一个OrderedDict的字典  
l=sorted(m.items(),key=lambda e:e[1],reverse=True)  //将普通的字典m,按照value值进行排序
  
// 若 e[0] ,则按照key值进行排序
  

  
// 将排序好的普通字典的值,在存放到具有顺序的OrderedDict字典中
  
for i in l:
  
    key,value=i
  
    d[key] = value
  
print d

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-548836-1-1.html 上篇帖子: python py、pyc、pyo、pyd文件区别 下篇帖子: python 多线程插入mysql
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表