设为首页 收藏本站
查看: 645|回复: 0

[经验分享] 对前一次python统计的优化

[复制链接]

尚未签到

发表于 2017-5-3 06:05:26 | 显示全部楼层 |阅读模式
import re
import copy
for i in infile:
temp = file(i)
text= temp.read()
for j in range(len(li)):
m = re.findall(li[j].website,text,re.S|re.M|re.L)
if len(m) != 0:
cdncopy = copy.deepcopy(li[j].cdn)
cdncopy.append(i[:-6])
li[j].cdn = cdncopy
li[j].number += 1


前一次设计的文件读写操作过多,每个文件只读取一次
用到了re模块,主要用来作正则匹配的,但是由于读取文件来做匹配,所以字符串中会包含\n,所以re.S|re.M|re.L很重要,用来告之进行多行匹配
用到了copy模块,因为我在list中又有一个子list,而list的append函数是不做深拷贝的,所以:
list[0].cdn.append("快网")
list[18].cdn.append(“快网”)
print list[0].cdn #["快网",“快网”]
print list[18].cdn #["快网",“快网”]
就像是cdn被共用了
因此需要用深拷贝将其拷贝出来再复制,这是大多数新人容易犯的错误(包括我)
#此处是搜集到的理解深拷贝,前拷贝的两个例子

li=[]
next=[None,None]
for i in range(5):
next[0]=i
next[1]=i
li.append(next)
print li
li=[]
for i in range(5):
next=[]   
next.append(i)
next.append(i)
li.append(next)
print li


结果:
[[4, 4], [4, 4], [4, 4], [4, 4], [4, 4]]
[[0, 0], [1, 1], [2, 2], [3, 3], [4, 4]]
#另一个例子
1. copy.copy 浅拷贝 只拷贝父对象,不会拷贝对象的内部的子对象。
2. copy.deepcopy 深拷贝 拷贝对象及其子对象
用一个简单的例子说明如下:
>>>import copy
>>>a = [1, 2, 3, 4, ['a', 'b', 'c']]
>>> b = a
>>> c = copy.copy(a)
>>> d = copy.deepcopy(a)
很容易理解:a是一个列表,表内元素a[4]也是一个列表(也就是一个内部子对象);b是对a列表的又一个引用,所以a、b是完全相同的,可以通过id(a)==id(b)证明。
第4行是浅拷贝,第五行是深拷贝,通过id(c)和id(d)可以发现他们不相同,且与id(a)都不相同:
>>> id(a)
19276104
>>> id(b)
19276104
>>> id(c)
19113304
>>> id(d)
19286976
至于如何看深/浅拷贝的区别,可以通过下面的操作来展现:
>>> a.append(5)    #操作1
>>> a[4].append('hello')   #操作2
这时再查看结果:
>>> a
[1, 2, 0, 4, ['a', 'b', 'c', 'hello'], 5]
>>> b
[1, 2, 0, 4, ['a', 'b', 'c', 'hello'], 5]
>>> c
[1, 2, 3, 4, ['a', 'b', 'c', 'hello']]
>>> d
[1, 2, 3, 4, ['a', 'b', 'c']]
可以发现a、b受了操作1、2的影响,c只受操作2影响,d不受影响。a、b结果相同很好理解。由于c是a的浅拷贝,只拷贝了父对象,因此a的子对象( ['a', 'b', 'c', 'hello'])改变时会影响到c;d是深拷贝,完全不受a的影响

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-372221-1-1.html 上篇帖子: Python入门系列:List基本操作 下篇帖子: 程序 python 抓取新浪读书频道小说
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表