qq70191 发表于 2018-8-7 13:29:19

Python中字典的近亲——集合

  集合的两个功能
  1.集合可以实现去重的功能;
  2.集合可以实现关系测试:交集,差集,并集,是否子集,是否没有交集
  以一个应用场景来引出集合:
  现在IPV4下用一个32位无符号整数来表示,一般用点分方式来显示,点将IP地址分成4个部
  分,每个部分为8位,表示成一个无符号整数(因此不需要用正号出现),如10.137.17.1,
  是我们非常熟悉的IP地址,一个IP地址串中没有空格出现(因为要表示成一个32数字)。
  现在需要你用程序来判断IP是否合法。
  (1)输入描述:输入一个ip地址
  (2)输出描述:返回判断的结果YES or NO
  示例1
  1.输入: 10.138.15.1
  2.输出: YES
  #!/usr/bin/env python
  #coding:utf-8
  #172.25.254.1
  ip = raw_input('ip:')
  #["172"."25"."254"."1"]
  ip = ip.split('.')
  #一次判断每一部分是否合法;
  for i in ip:
  if 0<=int(i)<=255:
  print 'YES'
  break
  else:
  print 'NO'
  场景1: li = ['a', 'b']
  场景2: 社联要统计所有加入社团的学生?
  li1 = ['a', 'b', 'c'] li2 = ['a', 'c']
  all = []
  for i in li1: for j in li2:
  列表解决太麻烦;
  set(li1 + li2) set(li1.extend(li2))
  一.集合set的定义
  1.集合是不重复的数据结构;
  (1)花括号里面为空,是字典类型;
  In : s = {}
  In : type(s)
  Out: dict

  (2)定义集合的第一种方式;
  In : s = {1, 2, 3, 1, 2}
  In : type(s)
  Out: set
  In : print s
  set()

  2.工厂方法定义集合时,括号里面是可迭代的对象, eg: 数值类型不可以;
  (1)定义集合的第二种方式:定义一个空集合
  In : s = set()
  In : type(s)
  Out: set

  (2)定义集合
  *字符串
  In : s = set('hello')
  In : print s
  set(['h', 'e', 'l', 'o'])

  *字典
  In : s = set({'a':1, 'b':2, 'c':3})
  In : print s
  set(['a', 'c', 'b'])
  *元组
  In : s = set((1, 2, 3, 4))
  In : print s
  set()
  *列表
  In : s = set()
  In : print s
  set()

  二.应用:实现列表去重
  1,转换为集合数据类型:set(列表)
  2.字典的fromkeys方法实现;
  (1)实现列表去重
  In : li =
  In : s = set(li)
  In : li = list(s)
  In : print s
  set()

  In : print li
  
  (2)fromkeys方法实现列表去重
  In : li =
  In : d = {}.fromkeys(li)
  In : print d.keys()
  

  三.集合的特征
  1.集合是无序的, 不重复的数据类型;
  2.因此不支持索引,也不支持切片;也不支持重复;也不支持连接;
  3.支持成员操作符;
  4.支持for循环;
  (1)成员操作符:
  In : s = {1, 2, 3, 4, 1, 2}
  In : 1 in s
  Out: True
  In : 1 not in s
  Out: False

  (2)集合支持for循环,是可迭代的:
  In : for i in s:
  ....:   print i
  ....:
  1
  2
  3
  4

  四.集合的增三改查
  1.增
  In : s = {1, 2, 3, 4, 1, 2}
  In : s.add(8)
  In : s.add(1)
  In : print s
  set()

  In : s1 = {'a', 'b', 'c'}
  In : s.update(s1)
  In : print s
  set(['a', 1, 2, 3, 4, 8, 'c', 'b'])

  2.改
  3.查
  关系测试操作
  In : s1 = {1, 2, 3, 4}
  In : s2 = {1, 2, 3, 5}
  #交集
  In : s1 & s2
  Out: {1, 2, 3}
  #并集
  In : s1 | s2
  Out: {1, 2, 3, 4, 5}
  #差集
  In : s1 - s2
  Out: {4}
  In : s2 - s1
  Out: {5}
  #对等差分
  In : s1 ^ s2
  Out: {4, 5}

  #交集
  In : s1.intersection(s2)
  Out: {1, 2, 3}
  #并集
  In : s1.union(s2)
  Out: {1, 2, 3, 4, 5}

  #差集
  In : s1.difference(s2)
  Out: {4}
  In : s2.difference(s1)
  Out: {5}

  #对等差分
  In : s1.symmetric_difference(s2)
  Out: {4, 5}

  In : s1 = {1, 2, 3, 4}
  In : s2 = {1, 2, 3}
  #s2是否s1子集
  In : s2.issubset(s1)
  Out: True
  #s1是否是s2的父集
  In : s1.issuperset(s2)
  Out: True
  #是否没有交集
  In : s1.isdisjoint(s2)
  Out: False
  4.删
  In : s = {1, 'a', 'hello', 45,}
  (1)s.pop()    #随机删除一个,返回一个对象
  In : s.pop()
  Out: 'a'

  (2)s.remove   #删除指定元素,是set成员则删除,不是成员报错
  In : s.remove(1)
  In : print s
  set()
  In : s.remove(‘b’)
  File &quot;<ipython-input-77-fe0f6997b18b>&quot;, line 1
  s.remove(‘b’)
  ^
  SyntaxError: invalid syntax

  In : print s
  set()
  (3)s.discard()    #删除指定元素,是成员删除,不是成员什么都不做
  In : s.discard(45)
  In : s.discard('b')
  In : print s
  set(['hello'])

  (4)s.clear()    #清空集合元素
  In : s.clear()
  In : s
  Out: set()

  应用:
  (华为机试题)题目描述
  明明想在学校中请一些同学一起做一项问卷调查,为了实验的客观性, 他先用计算机生成了N个1到1000
  之间的随机整数(N≤1000), N是用户输入的,对于 其中重复的数字,只保留一个,把其余相同的数去
  掉,不同的数对应 着不同的学生的学号。然后再把这些数从小到大排序,按照排好的顺 序去找同学做调
  查。请你协助明明完成“去重”与“排序”的工作;
  提示:
  生成随机数,
  import random
  random.randint(1,1000)
  列表的去重
  #!/usr/bin/env python
  #coding:utf-8
  import random
  s = set()
  N = input('输入一个数:')
  for i in range (N) :
  s.add(random.randint(1,1000))
  #sorted是内置方法用来排序;
  print sorted(s)
  #li = list(s)
  #li.sort()
  #print li
  总结
  可变数据类型: 列表, 字典, 集合
  不可变数据类型: 数值类型, 字符串, 元组
  可变数据类型实现某个功能, 直接改变可变的数据类型;
  不可变数据类型实现某个功能,需要将结果赋值给另外一个变量;
  是否实现for循环
  可迭代数据类型: str, list, tuple, dict, set
  不可迭代数据类型:数值类型
  是否支持索引,切片, 重复和连接特性
  有序的数据类型: str, list, tuple
  无序的数据类型: dict, set
页: [1]
查看完整版本: Python中字典的近亲——集合