设为首页 收藏本站
查看: 723|回复: 0

[经验分享] Python学习笔记(1)——数组差集

[复制链接]
累计签到:1 天
连续签到:1 天
发表于 2015-11-30 15:12:08 | 显示全部楼层 |阅读模式
  面试的时候被问到这样一个问题:有A、B两个数组,找出B中有A中没有的所有元素(换言之即是求差集B-A)。当时比较紧张,用了最原始的双重嵌套循环逐个比较,很显然这种时间复杂度高达O(n2)的算法相当low。
  回去之后经过思考,有了一个新的思路,即先对A、B进行排序,时间复杂度为O(nlog2n),再对排序后的数组同时遍历进行比较,这里的时间复杂度为O(n),这样总体的时间复杂度为O(nlog2n),效率比之前有了改进。(PS:在网上搜索过之后,发现还有hash的方法可以更简单,这里暂不详叙。)
  于是用刚学不久的Python来编写代码实现新的思路:


DSC0000.gif DSC0001.gif


1 a=[1,2,3,4,5,7,9,11,19,17]
2 b=[1,2,4,5,6,8,10,12,14,22,16,15]
3
4 a.sort()
5 b.sort()
6 print "sorted a=",a
7 print "sorted b=",b
8
9 i=0,j=0
10 print ("The numbers which are in list b but not in list a include:")
11 while i<len(a) and j<len(b):
12     if a==b[j] :
13         i=i+1
14         j=j+1
15     elif a>b[j] :
16         c.append(b[j])
17         j=j+1
18     elif a<b[j] :
19         i=i+1
20 while j<len(b):
21     c.append(b[j])
22     j=j+1
23 print(c)
View Code  输出的结果为:
  sorted a= [1, 2, 3, 4, 5, 7, 9, 11, 17, 19]
       sorted b= [1, 2, 4, 5, 6, 8, 10, 12, 14, 15, 16, 22]
       The numbers which are in list b but not in list a include:
       [6, 8, 10, 12, 14, 15, 16, 22]
  与预期的结果一致。
  PS:这里的代码有一点小问题,因为之前用Python3,后来改成了Python2.7,在后者中,print的内容不需要括号,而代码中多余的括号并没有完全移除,这里因为每一句print的内容只有一个,所以输出结果不会有差别,但是如果同一句print要输出多个元素,就会出现不同的情况。举个例子:
  print "a","b"
  print ("a","b")
  这样的两行代码,在Python3中,前一句会报错,后一句会输出:a  b 。
  而在Python2.7中,前一句会输出:a b,后一句会输出:('a','b')。

  学习了一段时间Python后,发现了set()这个数据结构。在Python中,set()是一种无序不重复的数据结构,并且可以直接进行求交集、并集、差集的步骤。于是,上述问题可以直接这样写:





1 import copy
2
3 a=[1,2,3,4,5,7,9,11,19,17]
4 b=[1,2,4,5,6,8,10,12,14,22,16,15]
5
6 A=copy.copy(a)
7 B=copy.copy(b)
8
9 print "A=",A
10 print "B=",B
11 print "Another way to solve it : "
12 print list(set(B)-set(A))
View Code  输出的结果为:
  Another way to solve it :
  [6, 8, 10, 12, 14, 15, 16, 22]
  结果也是正确的。
  思路很简单,把list先转变成set,求差集之后再转回list即可。注意这里用了Python的copy这个库,因为这段代码和前面的方法实际上是写在同一个程序中,如果直接用A=a,B=b的话,A和B的内容将是排序后的a和b。理由是A=a的写法只是让A指向a的引用地址,a改变的时候,A也会随之改变;用copy.copy()的话,A才能记录原始的数组a。

  用set()的方法只需要一行代码,相当简洁,但是这里存在另外一个问题:假如数组b中存在着若干个重复的元素,且这些元素不存在于数组a中,而要求的结果恰好需要重复的元素也一并列出,并且不能改变元素在数组b中出现的顺序。比如a=[1,5,2],b=[2,4,3,3],按照要求需要输出[4,3,3],然而由于set()是不重复的数据结构,如果采取上述方法会自动排序和自动剔除重复的元素,输出为[3,4],和要求不符合,那么只能寻找其他的方法了。
  之后在operator库中找到了方法,代码如下:





1 import operator
2 a=[1,5,2]
3 b=[2,4,3,3]
4
5 print "Without changing the order :"
6 for num in b:
7     if operator.contains(a,num)==False:
8         print num,
View Code  输出的结果为:
  Without changing the order:
  4,3,3
  这样即使重复出现在数组b中的元素3也能在结果中同样重复出现,元素顺序也没有更改。operator.contains(a,num)语句的作用是判断num是否在a中,在的话为True,否则为False。

  最后查看了一下operator的源码,发现operator.contains(list,num)函数的定义仅仅是判断num in list or not,于是得到了不使用库的版本:





1 a=[1,5,2]
2 b=[2,4,3,3]
3 print "With no modules:"
4 for num in b:
5     if num not in a:
6         print num,
View Code  输出的结果为:
  With no modules:
  4,3,3
  

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-145497-1-1.html 上篇帖子: python中的编码与解码 下篇帖子: Python学习(六)模块
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表