设为首页 收藏本站
查看: 1008|回复: 0

[经验分享] python 实现nginx/apache 日志格式的统计脚本

[复制链接]
累计签到:1 天
连续签到:1 天
发表于 2016-8-4 08:52:02 | 显示全部楼层 |阅读模式
# !/usr/bin/env python
# -*- coding:utf8 -*-
import sys
import re
import time
import os

def main():
    months ={
       "jan": 1, "Feb": 2, "Mar": 3, "Apr": 4, "May": 5, "Jun": 6,
        "Jul": 07, "Aug": 8, "Sep": 9, "Oct": 10, "Nov": 11, "Dec": 12}
    error = '请输入正确的时间格式,例如 2016-08-03 10:00:00'
    start = raw_input("请输入要查询的开始时间段如:2016-08-03 10:00:00")
    #start = '2016-08-03 10:37:00'
    pattern = re.compile("^201[3-6]-(0[0-9]|1[0-2])-([0-2][0-9]|3[0-1])\s([0-1][0-9]|2[0-3]):[0-5][0-9]:[0-5][0-9]$")
    i_start = re.match(pattern, start)
    if i_start == None:
        print error
        sys.exit(0)
    end = raw_input("请输入要查询的结束时间段如:2016-08-03 10:01:00")
    #end = '2016-08-03 10:38:00'
    i_end = re.match(pattern, end)
    if i_end == None:
        print error
        sys.exit(0)
    print "time format is true !"

    ## 获取格式的时间的定时间戳 ##
    start_stamp = time.mktime(time.strptime(start, "%Y-%m-%d %H:%M:%S"))

    end_stamp = time.mktime(time.strptime(end, "%Y-%m-%d %H:%M:%S"))

    ## 处理文件 ###
    log_abpath = raw_input("请输入log文件的绝对路径 例如:/var/log/apache2/access.log")
    filepath = os.path.exists(log_abpath)
    if not filepath:
        raise "对不起该目录文件不存在!!"
        sys.exit(0)
    print "文件存在!!"
    f = open(log_abpath, 'r')
    #f = open("/var/log/apache2/access.log", "r")
    logs = f.readlines()
    position = 0
    t_logs = []
    for log in logs:
        position += 1
        log = log.split(" ")
        log.insert(0, position)
        t_logs.append(log)

    for t_log in t_logs:
        #print type(t_log)
        tim = str(t_log[4][1:])
        mon = tim[3:6]
        #print mon
        #print tim
        #print type(tim)
        #print months[mon]
        tim_f = tim.replace(mon, str(months[mon]))
        #print tim_f
        d = time.strptime(tim_f, "%d/%m/%Y:%H:%M:%S")
        stamp = time.mktime(d)
        t_log.insert(1, stamp)

    # print t_logs
    count = 0
    for t_log in t_logs:
        if t_log[1] > start_stamp < end_stamp:
            print "该时间段内的请求日志出现在,"+str(t_log[0])+"行"
            count += 1
    if count != 0:
        print "该段时间内一共出现了%d次请求"%(count)
    else:
        print "对不起,我已经努力帮你找了,可是找到该段时间的日志信息"

if __name__ == '__main__':
    main()



运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-252509-1-1.html 上篇帖子: python_django 返回和 通用视图 下篇帖子: python2.7.12+ipython2.2.0安装过程 python 统计
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表