root 发表于 2018-8-5 12:09:09

python文件操作二

  1、常用函数:


[*]fileObject.read()  size为读取的长度,以byte为单位。如果不指定参数,表示一次性读取全部
  内容,以字符串形式返回,并且每一行结尾会有一个"\n"符号。
  代码示例1:
  

with open("text.txt","r") as pf:  
content = pf.read()
  
print content

  结果:
  abcede
  123
  this is a test文件操作jfedcba
  代码示例2:
  

with open("text.txt","r") as pf:  content = pf.read(2)
  print content
  

  结果:
  读取:ab


[*]fileObject.readline( )  一行,如果给定了size,有可能返回的只是一行的一部分,以字符串的形式返
  回,并且结尾会有一个换行符"\n"。读完一行,文件操作标记移动到下一行的
  开头
  列题1

  

with open("text.txt","r") as pf:  content = pf.readline()
  print content
  

  

  结果:
  大学之道,在明明德,在亲民,在止于至善。
  列题 1:
  

with open("text.txt","r") as pf:  content = pf.readline(15)
  print content
  

  

  结果:
  大学之道,


[*]fileObject.readlines( )  把文件每一行作为一个list的一个成员,是一个字符串,并且结尾会一个换行符"\n",并返回这个list。这个函数的内部是通过循环调用readline()来实现的。如果指定了size参数,表示读取文件指定内容的长度,此时就有可能只能读取文件的一部分

  

  
with open("text.txt","r") as pf:
  content = pf.readlines()
  print content
  for line in content:
  print line
  

  结果:



[*]fileObject.write( str )  把str写到文件中,默认是不加换行符的,所以如果想换行的话,得手动加入换行符'

  

with open("test.txt","w") as pf:  pf.write("我是最帮的!!\n学习文件写入操作")
  

  结果:
  我是最帮的!!
  学习文件写入操作


[*]fileObject.writelines( seq )  把seq(序列)的内容全部写到文件中(多行一次性写入)。也不会自动加入换行符
  如:

  

content = "我是最帮的!!\n学习文件写入操作,加油!!!"  
with open("test.txt","a") as pf:
  pf.writelines(content)
  

  

  结果:
  我是最帮的!!
  学习文件写入操作我是最帮的!!
  学习文件写入操作,加油!!!


[*]fileObject.close()  File 对象的 close()方法刷新缓冲区里任何还没写入的信息,并关闭该文件,这之后便不能再进行写入。当一个文件对象的引用被重新指定给另一个文件时,Python 会关闭之前的文件。用 close()方法关闭文件是一个很好的习惯。如果文件关闭后,还对文件进行操作就会产生ValueError错误,但如果不及时关闭文件,有可能产生句
  柄泄露,丢失数据
  #打开文件准备写文件

  

fp = open( "c:\\test.txt",'w')  
print u"文件名:", fp.name
  
#关闭文件
  
fp.close()
  
print u"文件是否关闭:", fp.closed
  

  结果:
  文件名: test.txt
  文件是否关闭: True


[*]  fileObject.flush()
  该函数是将缓冲区中的内容写入硬盘

[*]fileObject.tell()  返回文件操作标记的当前位置,以文件的开头为基准点

  

with open("test.txt","r") as pf:  print u"当前文件操作标记位置为:", pf.tell()
  line = pf.readline()
  print u"读取一行后文件操作标记位置为:", pf.tell()
  

  结果:
  当前文件操作标记位置为: 0
  读取一行后文件操作标记位置为: 23


[*]fileObject.seek( offset[, from ] )  tell()方法告诉你文件内的当前位置;换句话说,下一次的读写会发生在文件开头这么多字节之后。seek(offset [,from])这是一个文件定位函数,该方法改变当前文件的位置。 Offset变量表示要移动的字节数。From变量指定开始移动字节的参考位置。如果from被设为0(默认值),这意味着将文件的开头作为移动字节的参考位置。如果设为1,则使用当前的位置作为参考位置。如果它被设为2,那么该文件的末尾将为参考位置。需要注意,如果文件以a或a+的模式打开,每次进行写操作时,文件操作标记会自动返回到文件末尾。测试文件test.txt,内容如下:

  

with open("test.txt","r") as fp:  str = fp.read(18)
  print u"读取的字符串是 : ", str
  # 查找当前位置
  position = fp.tell()
  print u"当前文件位置 : ", position
  # 把指针再次重新定位到文件开头
  position = fp.seek(0, 0)
  str = fp.read(18)
  print u"重新读取字符串 : ", str
  

  

  结果:
  读取的字符串是 :我是最帮的!
  当前文件位置 :18
  重新读取字符串 :我是最帮的!
  fileObject.truncate( )
  把文件裁成规定的大小,默认的是裁到当前文件操作标记的位置。如果size比件的大小还要大,依据系统的不同可能是不改变文件,也可能是用0把文件补到相应的大小,也可能是以一些随机的内容加上去。
  

with open("test.txt","r") as fp:  print "Name of the file: ", fp.name
  line = fp.readline()
  print "Read Line: %s" % (line)
  print fp.tell()
  # Try to read file now
  remainingLine = fp.readline()
  print "Read Line: %s" % (remainingLine)
  

  


[*]linecache  模块允许从任何文件里得到任何的行,并且使用缓存进行优化,常见的情况是从单
  个文件读取多行。

[*]linecache.getlines(filename)  从名为 filename 的文件中得到全部内容,输出为列表格式,以文件每行为列表中的一个元素,
  并以 linenum-1 为元素在列表中的位置存储

[*]linecache.getline(filename,lineno)  从名为 filename 的文件中得到第 lineno 行。这个函数从不会抛出一个异常–产生错误时它将
  返回”(换行符将包含在找到的行里)。
  如果文件没有找到,这个函数将会在 sys.path 搜索。

[*]linecache.clearcache()  清除缓存,如果你不再需要先前从 getline() 中得到的行

[*]linecache.checkcache(filename)  检查缓存的有效性。如果在缓存中的文件在硬盘上发生了变化,并且你需要更新版本,使用
  这个函数,执行此函数会讲淘汰的内容删除。如果省略 filename,将检查缓存里的所有条目。

[*]linecache.updatecache(filename)  更新文件名为 filename 的缓存。如果 filename 文件更新了,使用这个函数可以更新

[*]  linecache.getlines(filename)
  返回的列表。如果出错,则返回空列表。

[*]删除空行的方法

  

    fp = open(r'test.txt')  aList = []
  for item in fp:
  if item.strip():
  aList.append(item)
  fp.close()
  fp = open(r'test2.txt', 'w')
  fp.writelines(aList)
  

  

def delblankline(infile, outfile):  """ Delete blanklines of infile """
  infp = open(infile, "r")
  outfp = open(outfile, "w")
  lines = infp.readlines()
  for li in lines:
  if li=='\n': #不同操作系统下可能会有不同
  print u'空行'
  if li.split():
  outfp.write(li)
  infp.close()
  outfp.close()
  

  
if __name__ == "__main__":
  
delblankline("c:\\1.txt","c:\\2.txt")
  

  

  列题:
  数据文件:data.log
  20160215 000148|0|collect info job start|success|
  20160215000153|0|collect info job
  end|success|resultcode = 0000
  20160216000120|0|collect info job start|success|
  20160216000121|0|collect info job
  end|success|resultcode = 0000
  20160217000139|0|collect info job start|success|
  20160217000143|0|collect info job
  end|success|resultcode = 0000
  数据分析需求:
  每行内容需要生成以每行
  首年月日为名称的文件,
  文件内容写入|0|后的所有
  行内容(也包括|0| )
  算法分析:
  遍历每一行,每行取头8个字母
  新建文件,文件名为首8个字母,然后把第15字符后的所有字
  符拷贝到文件中
  关闭文件
  

fp =open("e:\\data.log")  
for line in fp.readlines():
  filename = line[:14]
  content = line
  

  with open("e:\\"+filename+".txt","w") as fp2:
  fp2.write(content+"\n")
  

  
fp.close()
  
页: [1]
查看完整版本: python文件操作二