设为首页 收藏本站
查看: 1495|回复: 0

[经验分享] python设置检查点简单实现

[复制链接]

尚未签到

发表于 2017-5-4 11:24:58 | 显示全部楼层 |阅读模式
  说检查点,其实就是对过去历史的记录,可以认为是log.不过这里进行了简化.举例来说,我现在又一段文本.文本里放有一堆堆的链接地址.我现在的任务是下载那些地址中的内容.另外因为网络的问题或者网站的问题,每次下载可能不会非常的成功.有可能出现断链或者socket异常错误。不过不管产生什么样的错误,我都希望我的程序能够一直跑下去。或者能停掉后,继续从为下载的链接处跑。而不是从开始的地方跑。这个问题非常简单。因为这些链接是上下文无关的(上下文有关的情况要另外分析)。所以我只要记录程序运行停止前的最后一条,就有希望能够延续前面的工作。这里实现中使用的是记录原有的链接,大家也可以使用计数器的方法来记录。代码如下:
# 这个异常是原文本内容中未出现检查点内容出现造成的class CheckPointMissContentError:pass# 将文件读取指针fd移至到检查点对应的内容处# check point 的规则为,读取文件一行或者多行,进行操作后,将此一行或多行送入# 检查文件check_point中。以后再次运行程序,即可从该检查点处继续运行。def GoCheckPoint(fd,check_point):if not os.path.isfile(check_point):f_check = open(check_point,'w')f_check.close()f_check = open(check_point,'r')lines = f_check.readlines()if len(lines) > 0:check_content = lines[-1] #找到检查点最后一行check_content = check_content.strip(' \n\r')# go to check pointwhile True:content = fd.readline()if content == '': # eofraise CheckPointMissContentErrorif content.strip(' \n\r') == check_content:breakf_check.close()#关闭检查点
  有了上面一段还是不够的,需要下面的代码补充:
  # 伪代码def Download(downloadlist,sleep_time):if os.path.isfile(downloadlist):f = open(downloadlist)# check_point file name,这里为自动生成一个检查点文件check_point = file[0:file.rfind('.')]+'_check.txt'Util.GoCheckPoint(f,check_point) #这就是上面代码中的GoCheckPoint函数f_check = open(check_point,'a')# 以追加方式写入try:while True:content = f.readline()if content == '': # eofbreakcontent = content.strip(' \n\r')if content != '':# has download urltime.sleep(sleep_time)DownloadOper(path,url) #这里是伪代码..可以认为是urllib.request.retrieve()函数或者是urllib.request.urlopen()啥的# 作为响应的操作后再将内容写入检查点文件f_check.write(content+'\n')f_check.flush() # 必须的,否则会缓存,不会写入硬盘中except : # 蹦个异常也不怕,以后再次按F5执行即可raise Exception()return Util.FAILURE # 这是我设置的常量,大家认为是0或者1就可以了finally:f.close()f_check.close()# 关闭文件print('Downloading  is done........................')return Util.SUCCESS
  执行完操作之后再写入到检查点文件中。以后程序挂掉,只要检查点文件还在,就可以延续前面的工作。不过这里的检查点相对于数据库中事务处理的检查点还是太简单了点。

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-372963-1-1.html 上篇帖子: python os.path模块 简明文档 下篇帖子: python 引用,浅copy和深拷贝
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表