设为首页 收藏本站
查看: 956|回复: 0

[经验分享] 文件切割 python

[复制链接]

尚未签到

发表于 2017-4-24 11:01:24 | 显示全部楼层 |阅读模式
对文件进形切割的处理  考虑到文件在切的时候,还在边写内容,所以掉了shell脚本

源码如下
原创
配置文件内容
knife.cfg
[split_config]
path=c:\
name=test
suf=txt
size=1
unit=K
count=5


#!/usr/local/bin/python
# -*- coding: utf-8 -*-
'''
Created on 2012-2-15
@author: cooler
'''
import ConfigParser
from datetime import datetime
import os
from os.path import getsize

c_path = "../conf/knife.cfg"
class fileSplit:
c_line = 0; # 当前文件在多少行
f_count = 1 # 拆装文件后缀
d_flag = False # 判断文件是否删除
path = ""
conf = {}
#获取配置文件信息
def getCfg(self):
cp = ConfigParser.ConfigParser()
cp.read(c_path)
self.conf["path"] = cp.get("split_config", "path").strip()
self.conf["name"] = cp.get("split_config", "name").strip()
self.conf["size"] = cp.get("split_config", "size").strip()
self.conf["unit"] = cp.get("split_config", "unit").strip()
self.conf["count"] = cp.get("split_config", "count").strip()
self.conf["suf"] = cp.get("split_config", "suf").strip()
#print self.conf["unit"]=='M' ,self.conf["unit"]=='K'
if(self.conf["unit"]=='M'):
self.conf['size'] = int(self.conf['size'])*(1024*1024)
elif(self.conf["unit"]=='K'):
self.conf['size'] = int(self.conf['size'])*(1024)
else :
self.conf['size'] = int(self.conf['size'])*(1024*1024)
#判断是否超过配置文件大小
def overSize(self):
size = getsize(self.conf['path']+self.conf['name']+str(self.f_count)+"."+self.conf['suf'])
#print size,self.conf['size']
if(size > int(self.conf['size'])):
return True
else :
return False
#获取源文件行数
def getLength(self):
try:
fileHandle = open(self.conf['path']+self.conf['name']+"."+self.conf['suf'])
c_list = fileHandle.readlines()  
return len(c_list)
except:
print " target file is not exist"
#切割文件
def knife(self,c_size):
try:
fileHandle = open(self.conf['path']+self.conf['name']+"."+self.conf['suf'])
c_list = fileHandle.readlines()
dtime = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
print "has new log  " +  dtime + "  lineCount: " + str(len(c_list))
for i in range(self.c_line,len(c_list)):
#print i , (i+1)==len(c_list),len(c_list)
#if ((i+1)==len(c_list)): # 设置删除文件调剂
#    self.d_flag = True
#else :
#    self.d_flag = False
self.newFile(c_list)
fileHandle.close()
self.c_line = len(c_list) # 一次处理完数据   这个变量可以启用
self.delContentByNum(0, len(c_list))
except:
print "target file is not exist"
#生成新文件
def newFile(self,strp):
try:
f = file(self.conf['path']+self.conf['name']+str(self.f_count)+"."+self.conf['suf'], r'a')
f.write(strp)
f.close()
if(self.overSize()):
#if(self.d_flag==False):
dtime = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
print "new file dtime:  " +  dtime + "  count : " + str(self.f_count)
self.f_count=self.f_count+1
if( self.f_count>int(self.conf['count'])):
self.removeFile()
f = file(self.conf['path']+self.conf['name']+str(self.f_count)+"."+self.conf['suf'], r'a')
f.close()
except:
print "no such file ~~ new file failure"
#删除前一个文件
def removeFile(self):
try:
path = self.conf['path']+self.conf['name']+str(self.f_count-(int(self.conf['count'])))+"."+self.conf['suf']
os.remove(path)
except:
print "no such file ~~ remove failure"
#删除元日志文件的前部分 调用linux命令删除源文件中的内容
def delContentByNum(self,fromNum,toNum):
common = "sed -i '"+str(fromNum+1)+","+str(toNum)+"d' " + self.conf['path']+self.conf['name']+"."+self.conf['suf']+""
os.popen(common)
self.c_line=0
if __name__ == '__main__':
fs = fileSplit()
while True:
fs.getCfg()
if(fs.getLength() > fs.c_line):
#print fs.getLength
fs.knife(fs.conf['size'])
#pass
#os.remove("c:\test2.txt")

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-368564-1-1.html 上篇帖子: python--数据结构 下篇帖子: 常用Python模块
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表