设为首页 收藏本站
查看: 660|回复: 0

[经验分享] apache访问日志access.log的解析以及如何将其导入mysql

[复制链接]

尚未签到

发表于 2016-10-23 08:15:19 | 显示全部楼层 |阅读模式
  首先,我们对apache访问日志进行一个解读,
  220.181.108.92 - - [22/Aug/2013:23:59:59 +0800] "GET /min/f=/media/js/jquery-1.7.2.media/js/global_interaction.js&201308221836 HTTP/1.1" 200 70550 "http://adfdfs.com.cn1071-2130-1.html"  "Mozilla/5.0 (X11; U; Linux x86_64;en-US; rv:1.9) Gecko Minefield/3.0"

  第一项信息是远程主机的地址,即它表明访问网站的究竟是谁。
  第二项是空白,用一个“-”占位符替代。实际上绝大多数时候这一项都是如此。这个位置用于记录浏览者的标识,这不只是浏览者的登录名字,而是浏览者的email地址或者其他唯一标识符,通常只是"-";

  第三项也是空白用一个占位符"-"来替代。这个位置用于记录浏览者进行身份验证时提供的名字。当然,如果网站的某些内容要求用户进行身份验证,那么这项信息是不会空白的。但是,对于大多数网站来说,日志文件的大多数记录中这一项仍旧是空白的。

  第四项,表示访问者的访问时间记录,无需多解释,时间信息最后的“+800”表示服务器所处时区位于UTC之后的8小时。
  第五项,是整个日志记录中最有用的信息,它告诉我们服务器收到的是一个什么样的请求
  第六项,200状态代码
  第七项,70500,是服务器发送给客户端的总字节数
  第八项,客户在提出请求时所在的目录或URL。
  第九项,客户端的详细信息
  根据需求可以建张表
  
CREATE TABLE IF NOT EXISTS `apache_log` (
`id` int(11) NOT NULL AUTO_INCREMENT COMMENT 'id号',
`hostip` char(32) NOT NULL DEFAULT '0.0.0.0' COMMENT '远程主机的IP地址',
`marking` char(30) COMMENT '浏览者的标识',
`client_name` char(30) COMMENT '浏览者的名字',
`addtime` char(64) NOT NULL COMMENT '浏览时间',
`time_zone` char(8) NOT NULL COMMENT '时区',
`method` char(8) NOT NULL COMMENT '方法',
`resource` char(64) NOT NULL COMMENT ' 请求的资源',
`protocol` char(8) COMMENT '请求使用的协议',
`status` int(5) COMMENT '状态代码',
`bytes` int(5) COMMENT '发送给客户端的总字节数',
`refer` char(128) COMMENT '客户在提出请求时所在的目录或URL',
`client_info` char(128) COMMENT '客户在提出请求时所在的目录或URL',
PRIMARY KEY (`id`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8 COLLATE=utf8_bin;

  
  
先用awk处理apache日志,将每一项都用空格分开,那么大家看到下面的好多数字就迷惑了,这到底是个什么东西呢。首先awk '{print 0 ,像apache日志的文本中每行写入一个0,原因是,表结构的第一个字段是自增列,我只要把0导入,0表示默认值,它就可以自动增长了。
cat apache_log|awk '{print 0 " "$1 " "$2 " "$3" " for (i=4;i<=NF;i++) printf $i;printf "\n"}'>> apache_log.txt


  
  mysql>load data infile "/root/apache_log.txt" into table apache_log fields terminated by " " lines terminated by '\n';
  ERROR 13 (HY000): Can't get stat of '/root/apache_log.txt' (Errcode: 13 - Permission denied)
  mysql>load data local infile "/root/apache_log.txt" into table apache_log fields terminated by " " lines terminated by '\n';

  Query OK, 2000 rows affected, 2672 warnings (0.61 sec)
Records: 2000 Deleted: 0 Skipped: 0 Warnings: 2672

  顺便比较一下load data infile 和load data local infile 区别
  如果你没有给出local,则服务器按如下方法对其进行定位:
1)如果你的filename为绝对路径,则服务器从根目录开始查找该文件.
2)如果你的filename为相对路径,则服务器从数据库的数据目录中开始查找该文件.
如果你给出了local,则文件将按以下方式进行定位:
1)如果你的filename为绝对路径,则客户机从根目录开始查找该文件.
2)如果你的filename为相对路径,则客户机从当前目录开始查找该文件.

  mysql> desc apache_log;
+--------------+-----------+------+-----+---------+----------------+
| Field    | Type   | Null | Key | Default | Extra     |
+--------------+-----------+------+-----+---------+----------------+
| id      | int(11)  | NO  | PRI | NULL  | auto_increment |
| hostip    | char(32) | NO  |   | 0.0.0.0 |        |
| marking   | char(30) | YES |   | NULL  |        |
| browser_name | char(30) | YES |   | NULL  |        |
| addtime   | char(64) | NO  |   | NULL  |        |
| time_zone  | char(8)  | NO  |   | NULL  |        |
| method    | char(8)  | NO  |   | NULL  |        |
| resource   | char(64) | NO  |   | NULL  |        |
| protocol   | char(8)  | YES |   | NULL  |        |
| status    | int(5)  | YES |   | NULL  |        |
| bytes    | int(5)  | YES |   | NULL  |        |
| refer    | char(128) | YES |   | NULL  |        |
| client_info | char(128) | YES |   | NULL  |        |
+--------------+-----------+------+-----+---------+----------------+
13 rows in set (0.00 sec)

  mysql> select * from apache_log limit 3;
+----+-----------------+---------+--------------+-----------------------+-----------+--------+--------------------------------------------+----------+--------+-------+-------+------------------------------------------------------------------------------------+
| id | hostip     | marking | browser_name | addtime        | time_zone | method | resource                  | protocol | status | bytes | refer | client_info                                   |
+----+-----------------+---------+--------------+-----------------------+-----------+--------+--------------------------------------------+----------+--------+-------+-------+------------------------------------------------------------------------------------+
| 1 | 220.181.108.116 | -    | -      | [21/Aug/2013:23:59:59 | +0800]  | "GET  | /search/prj/tag/2089-2124-2350-2354-1.html | HTTP/1.1 |  200 | 8181 | "-"  | "Mozilla/5.0(compatible;Baiduspider/2.0;+http://www.baidu.com/search/spider.html)"|
| 2 | 220.181.165.5  | -    | -      | [21/Aug/2013:23:59:59 | +0800]  | "GET  | /event/bushanping/admin_login.php     | HTTP/1.1 |  200 | 32095 | "-"  | "Mozilla/5.0(Windows;U;WindowsNT5.1;zh-CN;rv:1.9.1.1)Gecko/20090715Firefox/3.5.1"|
| 3 | 220.181.165.136 | -    | -      | [21/Aug/2013:23:59:59 | +0800]  | "GET  | /search/diy/server-status/         | HTTP/1.1 |  404 | 21795 | "-"  | "Mozilla/5.0(Windows;U;WindowsNT5.1;zh-CN;rv:1.9.1.1)Gecko/20090715Firefox/3.5.1"|
+----+-----------------+---------+--------------+-----------------------+-----------+--------+--------------------------------------------+----------+--------+-------+-------+------------------------------------------------------------------------------------+
3 rows in set (0.00 sec)

导入成功

  

  

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-290021-1-1.html 上篇帖子: mysql出现错误“ Every derived table must have its own alias” 下篇帖子: [转]mysql从一个表字段赋值给另一个表字段 收集
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表