设为首页 收藏本站
查看: 856|回复: 0

[经验分享] 使用 python 遍历目录下的文件

[复制链接]

尚未签到

发表于 2015-4-27 06:21:02 | 显示全部楼层 |阅读模式
  看到邮件列表里面讨论遍历一个目录下的文件 最 pythonic 的做法。有点绕 但是确实简洁实用。效率也很高。收藏下。
  
  分解下这神奇的一行代码吧

sum([[os.path.join(base,file) for file in files] for base,,files in os.walk(dir)],[])

这一句是两个嵌套的列表推倒,加上一个内置的sum函数得到了结果。sum在这里的用法不同于平常我们对sum的使用比较特殊。
列表推倒还是比较容易理解的。
首先外层的列表推倒 遍历出所有的 base 和 files, 这里的base是所有的路径,而files则是对应路径下的所有文件。
写成

In [16]: [(base, files) for base,,files in os.walk(dir)]
Out[16]:
[('/home/liwei/boxy',
['test.html',
'base.css',
'jquery-1.6.4.min.js',
'boxy.css',
'boxy.zip',
'jquery.boxy.js',
'clearboxy.css']),
('/home/liwei/boxy/images', ['icon
close.gif', 'poptbg.gif', 'btn.gif']),
('/home/liwei/boxy/bak', ['boxy
orig.css', 'screen.css'])]

可以看的很清楚了。路径和对应的文件列表。
然后对第一步列表推到得到的结果。再进行一次列表推到,作用是合并得到的路径和文件名,变成一个完整的路径。
单独拿一行出来。

('/home/liwei/boxy/bak', ['boxyorig.css', 'screen.css'])

这里要做的就是,吧上面这一行,变成下面这样的两行。

'/home/liwei/boxy/bak/boxyorig.css',
'/home/liwei/boxy/bak/screen.css',

方法也很简单,遍历出来的结果直接join就可以了。使用的是 os.path.join 这个方法。这里遍历了 files 。
合并起来

In [17]: [[os.path.join(base,file) for file in files] for base,,files in os.walk(dir)]
Out[17]:
[['/home/liwei/boxy/test.html',
'/home/liwei/boxy/base.css',
'/home/liwei/boxy/jquery-1.6.4.min.js',
'/home/liwei/boxy/boxy.css',
'/home/liwei/boxy/boxy.zip',
'/home/liwei/boxy/jquery.boxy.js',
'/home/liwei/boxy/clear
boxy.css'],
['/home/liwei/boxy/images/iconclose.gif',
'/home/liwei/boxy/images/pop
tbg.gif',
'/home/liwei/boxy/images/btn.gif'],
['/home/liwei/boxy/bak/boxy_orig.css', '/home/liwei/boxy/bak/screen.css']]

这一步得到了一个列表中嵌套列表的结构。
接下来轮到神奇的sum了。平常我们会用sum来计算一个列表的和例如

sum([1, 2, 3, 4])
10
这里的用法,简化了 实际上就是做了这么一件事情。
In [20]: sum([['a','b'],['c','d']],[])
Out[20]: ['a', 'b', 'c', 'd']

这里将一个二维的列表,拉平了。
sum本质上是把传给他的一个可迭代对象一个个的加起来,返回结果,我们知道列表也是可以相加的,得到的是一个新的列表,相当与是extend了原来的列表。sum可以接受第二个参数,它是一个可选参数,文档中介绍到,这个参数的作用是指定sum的起始元素,你可以设置成一个数值,一个列表,上面这个例子中,设置了一个空列表,相当与上面的代码执行了

[]+['a','b']+['c','d']

如果不给定起始的元素,那么sum默认会用一个int去加,这样就会报错了。int是不能和list相加的。
这个方法可以用于拉平一个列表。速度快,实用!

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-60895-1-1.html 上篇帖子: python实现简易数据库之三——join多表连接和group by分组 下篇帖子: 编译原理----词法分析程序----python语言版
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表