Python12 文件操作

gdx 发表于 2018-8-9 10:49:04

文件操作

　　Pycharm使用UTF-8格式，而Windows默认是GBK格式，所以默认pycharm是处理不了BGK格式的，所以要要定义使用UTF-8格式打开Windows文件的内容。
　　.read()：读取文件所有内容。

　　同样是读取文件内容，但是print(data2)时没有任何数据显示，这是因为data1读取完成的时候，光标位置处于test.txt文档中的最下面，所以当data2再去读取时，下面已经没有数据了。
1.读写

　　报错没有写入的权限。

　　使用’r’赋予只读权限，不写的话默认就是只读。

　　因为是只读所以不能写入

　　将其赋予写入权限

　　可以看到只能写入，却不能读取（代码中有读取的动作）。

　　可以看到test文档已经被写入内容了，但是内容却都写在了同一行。

　　\n表示换行符
　　f.close()，写入内容后需要关闭文档，关闭后自动保存。

　　注意’w’权限会覆盖之前有的内容。

　　可以看到文档中直接了内容，并不会覆盖。

　　每一行定义一个数字

　　读取了多行的内容，但是这样写的代码太多，可以使用循环替代重复代码

2.readlines

　　可以看到以列表的形式，将每一行的列表元素在同一行打印出来。

　　将列表的每一个元素分行打印出来，但是可以看到打印的时候将\n也打印出来了，所以显示的时候会有空行。

　　可以看到，通过strip分隔了空行（也就是删除，因为括号中是空格所以删除所有空格，如果是其他字符就删除对应的所有字符），显示就正常了。

[*]readlines的缺点　　Readlines会读取文件的所有内容，并将读取的内容放入到内存中，读取的文件小的话内存是可以接受的，但是如果读取的文件过大，超过了内存的大小就不可以了（比如内存8G，你的文件有20G）。

　　解决方法就是直接使用for循环就可以了
　　这种方式就是读取一行后，打印一行，在打印下一行前会把之前打印的内容在内存中删除，这样内存中就始终保存一行的内容，不会占据过大内存。
　　内存只保存一行是因为f打开的文件编程了一个叫迭代器的东西，迭代器后面会讲。
　　不使用readlines读取，显示的内容就不在会是列表了，也就无法将文档中的下标读取出来了，就没办法在通过匹配下标的方式去针对达到指定行进行操作了。
　　可以通过使用计数器来判断读取文档到多少行了。

　　###　3.文件修改

　　F_1是旧文件
　　F_2是新文件
　　要求：通过读取旧文件的指定内容，将其修改并写入新的文件中；如果没有读取到指定内容，也将新内容写入到新文件中。
　　代码含义：如果发现小明要去玩内容在文件中，就通过replace替换关键字；如果没有发现指定内容，根据else代码直接写入新文件中。
　　但是此代码中可以看到，出现了重复代码f_2.write(line)

　　只需要将缩进等级调整一下，如果发现指定内容就进行替换，之后会将替换内容写入到新文件。
　　即使没有发现指定内容，那么就不需要他换，直接将循环到旧文件的内容写入到新文件。

　　也可以将要查找和替换的信息赋值变量，然后用变量名称来代替。
4.with语句

　　使用with语句可以在该语句模块最后不适用close来关闭文件，因为with语句最后会自动关闭；
　　这里的as f，相当于f = open…….

　　可以通过with同时打开多个文件；
　　从代码中可以看出是分了多行来打开多个文件，其实也可以在同一行来打开，只不过python官网的开发规范说明了一行的开发代码不应该超过80个字符，当同时打开多个文件时，可能就超过了限制的80个字符，所以这里我们没打开一个文件就换一行来写代码。
总结
　　r只读
　　w只写（覆盖）
　　a追加（最后一行）
　　r+读写（读后可以写，如果是写就是追加到最后一行）
　　w+写读（覆盖后可以读）
　　a+追加写读
　　rb使用二进制模式打开（打开的数据都是bytes格式）
　　wb通过bytes的格式写入，如果使用过wb必须制定字符集（如：encoding='utf-8'），当夸系统平台时会用到二进制数据。
　　ab用二进制追加
　　seek：重置读取的下标位置到最顶
　　tell：查看当前下标的位置
　　truncate()：截断剩下的字符串（剩下也就是还没读取的），默认截断后面所有，括号中指定数字就是指定多少个字符。
　　flush()：一般文件需要关闭后才换刷新缓冲区将内容写入文件，但是用flush后不需要等文件关闭，直接指定缓冲，将内容写入文件
　　文件还有很多其他方法：

页: [1]

运维网's Archiver

Python12 文件操作