设为首页 收藏本站
查看: 1038|回复: 0

使用shell分析日志

[复制链接]

尚未签到

发表于 2018-8-30 08:06:31 | 显示全部楼层 |阅读模式
  一、开篇要说的话
  为何要日志分析昆哥说了:“首先要知道数据做什么用,怎么用,分析的意义在哪里!但是本身这个只是指导你工作决策的,不能太执迷! 我看很多人把大量时间都在折腾蜘蛛去了,也是不正确的方法!自己一定要搞清目的。。。。。“
  夜息说了:“日志分析关注的点要了解,要了解哪些维度,如何分析。。。。。“
  二、本文正题
  这里我就整理了下,本人经常拆份的一些项。Shell在Cygwin里跑的一些常用命令符语句,我用的是Windows下Cygwin……大牛的就就漂过。。。。
  【新手哈 有哪错的 望指点 学习,】
  现在把罗列下这些项:
  //统计不重复抓取数量
  //统计所有状态码数量
  //统计某个目录抓取次数
  //统计各个目录出现404响应码次数
  //统计404页面的抓取数量
  //统计每个ip下对应URL的抓取次数
  //提取百度蜘蛛访问数量前10的网站目录及访问次数,并按降序排列
  //提取某个目录百度蛛蛛访问次数
  //统计首页抓取的次数占总体抓取次数比率
  //统计404响应码占总响应码比率
  //计算百度抓取总时间与总抓取次数
  //计算百度抓取总字节数
  //计算平均每次每个网页抓取字节数(小数点后面大于5进1)
  底下都举一个例子,大家就自己套用。。 欢迎评论提问,吐槽。。。指正。。。
  下面我们就进入演示。。。。请大家盯紧了。。
  这是我日志截图:
DSC0000.png

  
  //统计不重复抓取数量
  cat baidu.log | awk '{print $4}'|sort|uniq|wc -l
   DSC0001.png
  
  //统计所有状态码数量
  awk '{print $10}' baidu.log |sort|uniq -c
   DSC0002.png
  //统计某个目录抓取次数grep "/shop" baidu.log | awk '{print $4}' |sort |wc –l
   DSC0003.png
  //统计各个目录出现404响应码次数
   DSC0004.png
  //统计404页面的抓取数量awk '{if($10=="404"){print $0}}' baidu.log|sort|uniq|wc -l
   DSC0005.png
  //统计每个ip下对应URL的抓取次数
  awk '{print $6,$4}' baidu.log |sort|uniq –c
   DSC0006.png
  /提取百度蜘蛛访问数量前10的网站目录及访问次数,并按降序排列
  awk '{print $4}' baidu.log |grep -P "[^/(a-zA-Z)|^/(a-zA-Z)/]"|awk -F"/" '{print $2}'|sort|uniq -c|sort -r|head -10
   DSC0007.png
  
  //提取某个目录百度蛛蛛访问次数
  cat baidu.log | grep “/shop/”| wc –l
  cat baidu.log |awk ‘{print $4}’ |grep “/shop/” |wc –l
  cat baidu.log |awk ‘{print $4} |awk –F”/” ‘{print $2}’|grep “shop”|wc -l
   DSC0008.png
  //统计首页抓取的次数占总体抓取次数比率cat baidu.log |awk '{print $4}'|awk '{if($0=="/"){n=n+1}}END{print n/NR*100"%"}'
   DSC0009.png
  //统计404响应码占总响应码比率
  cat baidu.log |awk '{print $10}'|awk '{if($0=="404"){n=n+1}}END{print n/NR*100"%"}'
   DSC00010.png
  
  //计算百度抓取总时间与总抓取次数
  cat baidu.log|awk '{FS=" "} {print $2}'|awk -F":" '{print $2}'| sort |uniq -c|awk 'BEGIN{print "小时","次数"} {print $2,$1}'|awk '{for(n=0;n

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-558661-1-1.html 上篇帖子: Linux基础知识——常用shell命令介绍(二) 下篇帖子: 监控系统资源的shell脚本
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表