设为首页 收藏本站
查看: 827|回复: 0

[经验分享] python数据结构之 set

[复制链接]

尚未签到

发表于 2018-8-10 09:47:02 | 显示全部楼层 |阅读模式
  在数学概念中,被意为整合元素的定义区域
  在python中,set最大的作用是用来去重
  set常见操作:
  In [158]: s ={1,1,1,1,2,22,33,3,3,3}
  In [159]: s
  Out[159]: {1,2, 3, 22, 33}
  在定义一个集合的时候,只能使用大括号定义最少一个值,不然会被认为字典进行定义
  在set中不能加入不可哈希的对象类型
  In [161]:hash('a')
  Out[161]:4952964627402403516
  查看列表的哈希值,可以发现这个对象不可被哈希
  In [162]: a =[1,2,3]
  In [163]:hash(a)
  ---------------------------------------------------------------------------
  TypeError                               Traceback (most recent call last)
  <ipython-input-163-fe724719d9a1>in <module>()
  ----> 1hash(a)
  TypeError:unhashable type: 'list'
  set元素必须是可以哈希运算,但是需要元素可以迭代的
  只要是能被迭代的元素都可以被加入到set中
  In [171]:list(s)
  Out[171]:['abc', b'abc']
  In [172]: a =list(s)
  In [173]: a
  Out[173]:['abc', b'abc']
  In [174]:set(a)
  Out[174]:{'abc', b'abc'}
  set.add增加元素
  增加一个元素到set中,如果存在则什么都不做,因为存在其值
  In [176]:s.add(1)
  In [177]: s
  Out[177]: {1,'abc', b'abc'}
  In [178]:s.add(2)
  In [179]: s
  Out[179]: {1,'abc', 2, b'abc'}
  set可以收集多个集合,同样的可以合并多个集合
  使用update进行更新
  In [180]:s.update({1,2,3},{5,7},(1,9,1))
  In [181]: s
  Out[181]: {1,'abc', 2, b'abc', 3, 5, 7, 9}
  In [185]:s.update({1})
  In [186]: s
  Out[186]: {1,'abc', 2, b'abc', 3, 5, 7, 4, 9}
  In [187]:s.update({10})
  In [188]: s
  Out[188]: {1,'abc', 2, b'abc', 3, 5, 7, 4, 9, 10}
  set.remove删除
  remove,将要删除的值转为hash,并按当前hash值定位其位置进行删除,这个hash将作为一个key进行操作
  In [193]: s
  Out[193]: {1,2, b'abc', 3, 5, 7, 4, 9, 10}
  In [194]:s.remove(b'abc')
  In [195]: s
  Out[195]: {1,2, 3, 4, 5, 7, 9, 10}
  查找元素的过程是非常快,因为是直接定义hash,并非是从头到尾去遍历
  discard 从集合移除一个元素
  与remove功能一样,但是discard并不会弹出异常:
  remove 删除一个异常索引会报出keyerror
  In [196]:s.remove('hahaha')
  ---------------------------------------------------------------------------
  KeyError                                Traceback (most recent call last)
  <ipython-input-196-185a5cf4c543>in <module>()
  ----> 1s.remove('hahaha')
  KeyError:'hahaha'
  discard 删除一个索引则不会返回任何信息
  In [197]:s.discard('hahaha')
  In [198]:
  pop  随机挑选一个弹出并返回
  pop只是随机弹出,并不能跟参数
  In [202]:s.pop()
  Out[202]: 2
  In [203]:s.pop()
  Out[203]: 3
  In [204]: s
  Out[204]: {4,5, 7, 9, 10}
  clear  清除集合内所有元素,但是要考虑GC内存回收问题
  set修改及查询
  在set中没有修改的概念,只有两种操作:
  删除元素 和追加元素
  查询:非线性结构,无法进行索引查询
  遍历:可以遍历所有可迭代的元素
  成员运算符
  成员运算符 in , not in ,效率很高
  非线性结构如果找哈希值,时间复杂度相当于索引遍历列表大O(1)
  看似通过值在遍历,实际上是用哈希值进行定位
  可哈希的类型
  数值型:int、float、complex
  布尔类:True、False
  字符串: str Bytes
  Tuple、None都是不可变类型,称为哈希类型
  对比list和set执行效率
  查看set执行效率
  导入模块timeit
  import timeit
  In [3]:%%timeit lst1 = set(range(1000))
  ...: a = -1 in lst1
  ...:
  38.1 ns ± 0.0493 ns per loop(mean ± std. dev. of 7 runs, 10000000 loops each)
  查看list效率
  In [1]:%%timeit lst1 = list(range(1000))
  ...: a = -1 in lst1
  ...:
  14.7 μs ± 99.3ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)
  
  总结:
  线性结构查询的复杂度是O(n), 随着规模增大耗时间越来越高
  set和字典都属于特殊结构,其中都存了hash作为key,时间复杂度可以做到O(1),查询时间与数据规模无关

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-549514-1-1.html 上篇帖子: Python基础:条件控制if 下篇帖子: python 中pickle文件学习记录
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表