设为首页 收藏本站
查看: 1396|回复: 0

[经验分享] 使用AWStats分析Nginx的访问日志

[复制链接]

尚未签到

发表于 2015-11-27 13:56:00 | 显示全部楼层 |阅读模式
  第一篇 原文地址:http://www.ibm.com/developerworks/cn/linux/l-cn-awstats-nginx/index.html

第二篇 原文地址:http://www.cnblogs.com/juxiaoqi/archive/2010/07/28/1787350.html


  第一篇
[size=0.76em]
[size=1.5em]前言

[size=0.76em]
在我的上一篇文章《使用 Nginx 提升网站访问速度》中介绍了 Nginx 这个 HTTP 服务器以及如何通过它来加速网站的访问速度。在实际的网站运营中,我们经常需要了解到网站的访问情况,例如每天有多少 IP 在访问、PV 数是多少、哪个 URL 访问量最大、用户使用最多的浏览器是哪个、都是通过什么方式知道这个网站的以及有多少用户访问出错等等,通过掌握这些信息来提高用户的体验,从而改善网站的质量。一般我们可以通过一些免费的访问统计网站例如
Google Analytics 来或者这些信息。但不足之处是这类网站只能对页面进行分析,不包括静态文件;另外可能有很多的站长不愿意使用这类工具来暴露自己的数据,种种的这些因素使站长希望自己来分析访问日志。而 awstats 就可以满足所有的这些需求。

[size=0.76em]
Awstats 是在 SourceForge 上发展很快的一个基于 Perl 的 WEB 日志分析工具,一个充分的日志分析让 Awstats 显示您下列资料:




  • 访问次数、独特访客人数,

  • 访问时间和上次访问,

  • 使用者认证、最近认证的访问,

  • 每周的高峰时间(页数,点击率,每小时和一周的千字节),

  • 域名/国家的主机访客(页数,点击率,字节,269域名/国家检测, geoip 检测),

  • 主机名单,最近访问和未解析的 IP 地址名单

  • 大多数看过的进出页面,

  • 档案类型,

  • 网站压缩统计表(mod_gzip 或者 mod_deflate),

  • 使用的操作系统 (每个操作系统的页数,点击率 ,字节, 35 OS detected),

  • 使用的浏览器,

  • 机器人访问(检测 319 个机器人),

  • 蠕虫攻击 (5 个蠕虫家族),

  • 搜索引擎,利用关键词检索找到你的地址,

  • HTTP 协议错误(最近查阅没有找到的页面),

  • 其他基于 URL 的个性报导,链接参数, 涉及综合行销领域目的.

  • 贵网站被加入"最喜爱的书签".次数.

  • 屏幕大小(需要在索引页补充一些 HTML 标签).

  • 浏览器的支持比例: Java, Flash, RealG2 reader, Quicktime reader, WMA reader, PDF reader.

  • 负载平衡服务器比率集群报告.

[size=0.76em]
Awstats 的运行是需要 PERL 环境的支持,从 awstats 的文档来看,它对 Apache HTTP Server 的支持是非常完美的,而当我们把 Web 服务器换成 Nginx 后,要运行 awstats 变得很麻烦。首先 Nginx 本身对 Perl 的支持是比较弱的,甚至官方也不建议使用;另外在日志格式上有需要修改后才能运行。

[size=0.76em]
本文主要介绍通过让 awstats 对日志统计的结果生成静态页面,然后通过 Nginx 输出以达到统计 Nginx 访问日志的效果,其中还包括如何让 Nginx 自动切割日志文件。


[size=0.76em]
回页首

[size=0.76em]
[size=1.5em]配置 Nginx 自动切割日志

[size=0.76em]
跟 Apache HTTP Server(以下称 Apache)不同的是,Apache 可以将日志输出通过管道的方式进行重新定向,依此来进行自动的日志切割。Nginx 在现今版本上还没能跟 Apache 一样,通过%YY等参数按日期分批创建日志,但是通过给 nginx 进程发送一个特定的信号,可以使 nginx 重新生成日志文件。我们可以定期执行一个 Shell 脚本来切换日志,重新命名或转移,具体的脚本如下:



# mv  /opt/nginx/logs/access.log /opt/nginx/logs/access_`date +%Y%m%d`.log
# killall –s USR1 nginx#使用USR1参数通知Nginx进程切换日志文件




[size=0.76em]
将以上脚本内容保存为文件名为 logcron.sh 存到自定的目录中,例如 /opt/nginx/sbin/logcron.sh

[size=0.76em]
使用 Crontab 让该脚本程序在每天晚上 11 点 59 分自动执行,即可做到按天创建日志。


[size=0.76em]
回页首

[size=0.76em]
[size=1.5em]安装和配置 Awstats

[size=0.76em]
安装之前,必须确认你的服务器上 Perl 的环境已经就绪。

[size=0.76em]
查看当前环境 Perl 版本的命令是 perl –version

[size=0.76em]
我们还需要对 Nginx 的日志格式做个小修改,不然 awstats 将无法进行统计。

[size=0.76em]
例子如下(加粗部分):



# vi /opt/nginx/conf/nginx.conf
server {
listen       80;
server_name  localhost;
location ~ ^/web/ {
root   /data/web;
index  index.html;
error_log off;
charset gb2312;
}
log_format  new_log#格式代称 (注意,如果有多个虚拟主机,代称不能一样)
'$remote_addr - $remote_user [$time_local] $request '
'"$status" $body_bytes_sent "$http_referer" '
'"$http_user_agent" "$http_x_forwarded_for"';
        access_log  logs/access.log new_log;#日志生成路径
}




[size=0.76em]
下载最新版本的 awstats 包,下载地址请见文章最后的参考资料。把下载后的 tar 包解压到任意目录中,例: /usr/local/awstats 。然后执行 tools 目录中的 awstats_configure.pl 配置向导,创建一个新的统计。



-----> Check for web server install
Enter full config file path of your Web server.
Example: /etc/httpd/httpd.conf
Example: /usr/local/apache2/conf/httpd.conf
Example: c:\Program files\apache group\apache\conf\httpd.conf
Config file path ('none' to skip web server setup):
#> none  #因为我们这里用的是 Nginx,所以写 none,跳过。




[size=0.76em]
回车



Your web server config file(s) could not be found.
You will need to setup your web server manually to declare AWStats
script as a CGI, if you want to build reports dynamically.
See AWStats setup documentation (file docs/index.html)
-----> Update model config file '/usr/local/awstats/wwwroot/cgi-bin/awstats.model.conf'
File awstats.model.conf updated.
-----> Need to create a new config file ?
Do you want me to build a new AWStats config/profile
file (required if first install) [y/N] ?
#> y#y 创建一个新的统计配置




[size=0.76em]
回车



-----> Define config file name to create
What is the name of your web site or profile analysis ?
Example: www.mysite.com
Example: demo
Your web site, virtual server or profile name:
#> www.moabc.net#统计网站的域名 例:
www.moabc.net




[size=0.76em]
回车



-----> Define config file path
In which directory do you plan to store your config file(s) ?
Default: /etc/awstats
Directory path to store config file(s) (Enter for default):
#>




[size=0.76em]
使用默认直接回车,接下来便会出现以下的提示



----> Add update process inside a scheduler
Sorry, configure.pl does not support automatic add to cron yet.
You can do it manually by adding the following command to your cron:
/usr/local/awstats/wwwroot/cgi-bin/awstats.pl -update -config=www.moabc.net  
#回头把该命令填入crontab 按指定时间执行
Or if you have several config files and prefer having only one command:
/usr/local/awstats/tools/awstats_updateall.pl now
Press ENTER to continue...回车继续
A SIMPLE config file has been created: /etc/awstats/awstats.www.moabc.net.conf  
#新配置文件所在的路径
You should have a look inside to check and change manually main parameters.
You can then manually update your statistics for 'www.moabc.net' with command:
> perl awstats.pl -update -config=www.moabc.net
You can also build static report pages for 'www.moabc.net' with command:
> perl awstats.pl -output=pagetype -config=www.moabc.net
Press ENTER to finish...




[size=0.76em]
回车完成向导,接下来修改 www.moabc.net 的统计配置

[size=0.76em]
#vi /etc/awstats/awstats.www.moabc.net.conf

[size=0.76em]
找到统计的日志文件的路径

[size=0.76em]
LogFile="/var/log/httpd/mylog.log"

[size=0.76em]
改为

[size=0.76em]
LogFile="/opt/nginx/logs/access_%YYYY-0%MM-0%DD-0.log

[size=0.76em]
对应上边 Nginx 日志切割程序的所生成的目录存放结构,要注意 Awstats 的年月日格式的跟 Nginx 的写法有所不同。我们现在执行统计的顺序是:

[size=0.76em]
Nginx 产生日志 –> 日志切割 –> Nginx 继续产生日志 –> 另存切割日志 –> 交由Awstats统计 –> 生成结果

[size=0.76em]
在本文中 Awstats 所统计的日志,是已切下来的那部分。也能调转顺序,先统计完了再切。不过这比较容易造成统计的遗漏。配置修改完成后,保存退出。然后我们可以开始试一下手动执行。




  • 先执行日志切割脚本 logcron.sh 把 Nginx 的日志切下来。

  • 然后执行 Awstats 日志更新程序开始统计分析。


# /opt/nginx/sbin/logcron.sh
# /usr/local/awstats/wwwroot/cgi-bin/awstats.pl -update -config=www.moabc.net
Create/Update database for config "/etc/awstats/awstats.www.moabc.net.conf"
by AWStats version 6.7 (build 1.892)
From data in log file "/opt/nginx/logs/access_20080804.log"...
Phase 1 : First bypass old records, searching new record...
Direct access after last parsed record (after line 450421)
Jumped lines in file: 450421
Found 450421 already parsed records.
Parsed lines in file: 120
Found 0 dropped records,
Found 0 corrupted records,
Found 0 old records,
Found 120 new qualified records.




[size=0.76em]
看到以上显示,证明日志切割和 Awstats 都已经运行无误了。统计分析完成后,结果还在 Awstats 的数据库中。在 Apache 上,可以直接打开 Perl 程序的网页查看统计。 但本文开始时已经提到,Nginx 对 Perl 支持并不好,所以我们要换个方法,利用 awstats 的工具将统计的结果生成静态文件,具体的步骤如下:




  • 首先在 webroot 目录下创建一个文件夹。例:/data/webroot/awstats

  • 然后让 Awstats 把静态页面生成到该目录中


# mkdir  /data/webroot/awstats
# /usr/local/awstats/tools/awstats_buildstaticpages.pl -update  \
-config=www.moabc.net -lang=cn -dir=/data/admin_web/awstats  \
-awstatsprog=/usr/local/awstats/wwwroot/cgi-bin/awstats.pl




[size=0.76em]
上述命令的具体意思如下:




  • /usr/local/awstats/tools/awstats_buildstaticpages.pl Awstats 静态页面生成工具

  • -update -config=www.moabc.net 更新配置项

  • -lang=cn 语言为中文

  • -dir=/data/admin_web/awstats 统计结果输出目录

  • -awstatsprog=/usr/local/awstats/wwwroot/cgi-bin/awstats.pl Awstats 日志更新程序路径。

[size=0.76em]
接下来,只需在nginx.conf 中,把该目录配置上去即可。 例子如下:(加粗部分):



server {
listen       80;
server_name  localhost;
location ~ ^/web/ {
root   /data/web;
index  index.html;
error_log off;
charset gb2312;
}
location ~ ^/awstats/ {    # html 静态页面目录
root   /data/webroot/awstats;
index  index.html;
access_log off;
error_log off;
charset gb2312; #最好把默认编码改成 gb2312避免浏览器因自动编码出现乱码的情况
}
location ~ ^/icon/ {             # 图标目录
root   /usr/local/awstats/wwwroot;
index  index.html;
access_log off;
error_log off;
charset gb2312;
}
}




[size=0.76em]
用浏览器查看到统计的详细结果 http://youhostname/awstats/awstats.www.moabc.net.html

[size=0.76em]
至此,使用 awstats 已能完全支持 Nginx 的日志统计。


[size=0.76em]
回页首

[size=0.76em]
[size=1.5em]配置 Awstats 自动运行

[size=0.76em]
为了让整个日志的统计过程自动完成,我们需要设置 crontab 计划任务,让 Nginx 日志切割以及 Awstats 自动运行,定时生成结果页面。



#vi /etc/crontab
11 59 * * * /opt/nginx/sbin/logcron.sh#半夜11:59  进行日志切割
00 1 * * * /usr/local/awstats/tools/awstats_buildstaticpages.pl  \
-update -config=www.moabc.net -lang=cn -dir=/data/admin_web/awstats \
-awstatsprog=/usr/local/awstats/wwwroot/cgi-bin/awstats.pl  
#凌晨00:01  Awstats进行日志分析
:wq保存退出
#crontab /etc/crontab指定cron所执行的配置档路径




[size=0.76em]
回页首

[size=0.76em]
[size=1.5em]保护日志统计结果页面

[size=0.76em]
一般站长都不愿随便让人知道自己站的真实流量,所以要把 Awstats 统计结果页面进行密码保护。Nginx 使用的是跟 Apache 一样的密码加密格式,这里需要用到 apache 自带的工具 htpasswd。

[size=0.76em]
如果你在本机上默认装有 Apache,这你就只需在它的程序目录下运行

[size=0.76em]
例:



#/usr/local/apache2/bin/htpasswd -c admin.pass admin #用户名为admin
New password:输入密码
Re-type new password:重复输入
Adding password for user admin创建成功
然后把 admin.pass 这个密码包找个的地方藏起来.
修改 nginx.conf 在 location 中加入(加粗部分):
server {
listen       80;
server_name  localhost;
location ~ ^/web/ {
root   /data/web;
index  index.html;
error_log off;
charset gb2312;
}
location ~ ^/awstats/ {    # html 静态页面目录
root   /data/admin_web;
index  index.html;
access_log off;
error_log off;
charset gb2312;
auth_basic     "admin"; #用户名
/opt/ngx/conf/admin.pass; #密码包路径

}
location ~ ^/icon/ {             # 图标目录
root   /usr/local/awstats/wwwroot;
index  index.html;
access_log off;
error_log off;
charset gb2312;
}
}
修改 Nginx 配置完毕后,执行命令 killall –s HUP nginx 让 Nginx 重新加载配置即可。




[size=0.76em]



[size=0.76em]
[size=1.5em]总结

[size=0.76em]
尽管跟 Apache HTTP Server 相比较而言,Nginx 的功能是比较弱的,但是我们依然可以利用一些技巧来规避这些弱点,Nginx 的设计者肯定也是充分考虑到这个问题。现在也越来越多的第三方开发的模块在逐渐的扩展 Nginx 的功能。但是从应用本身的角度而言,Nginx 更倾向于卓越的性能,而非大而全的功能,因而在一些附加方面的功能,我们也不能对之要求过高。

  


  


  第二篇

Nginx是一款性能很好的web服务程序,已经越来越多的被人使用。


安装方法:http://blog.s135.com/nginx_php_v6/


今天我想说说,如何分析Nginx日志,进而对用户习惯进行分析。


对用户的访问习惯进行分析,是网站运营中比较重要的环节。


我使用Awstats来分析Nginx日志。


Awstats默认支持Apache和IIS(见 http://www.chedong.com/tech/awstats.html ),需要设置一下才能分析Nginx日志。另外Nginx不支持Perl,而Awstats是Perl写的,所以需要一点变通的方法才能使用。


------------------------------------------------------------------






一 :设置Nginx日志格式、分割办法(以便后面Awstats读取)




安装过程就不介绍了,只要安装张宴同学的教程安装:http://blog.s135.com/nginx_php_v6/,就可以了。


重点说一下Nginx日志格式和分割日志的办法。




设置Nginx的日志格式为:



?

log_format
access  '$remote_addr
- $remote_user [$time_local] "$request" '
             '$status
$body_bytes_sent "$http_referer" '
             '"$http_user_agent"
$http_x_forwarded_for';
access_log
/data1/logs/access.log
access;





分割日志办法:


创建脚本/usr/local/webserver/nginx/sbin/cut_nginx_log.sh



?

vi
/usr/local/webserver/nginx/sbin/cut_nginx_log.sh



输入以下内容:



?

#!/bin/bash
#
This script run at 00:00
#
The Nginx logs path
logs_path="/usr/local/webserver/nginx/logs/"
mkdir
-p ${logs_path}$(date -d "yesterday" +"%Y")/$(date
-d "yesterday" +"%m")/
mv
${logs_path}access.log ${logs_path}$(date -d "yesterday" +"%Y")/$(date
-d "yesterday" +"%m")/access_$(date
-d "yesterday" +"%Y%m%d").log
kill
-USR1 `cat /usr/local/webserver/nginx/nginx.pid`





设置crontab,每天凌晨00:00切割Nginx日志



?

crontab
-e



输入以下内容:



?

1

00
00 * * * /bin/bash  /usr/local/webserver/nginx/sbin/cut_nginx_log.sh





这样每天零点准时切割Nginx日志,以日期为文件名保存。


例如:/data1/logs/2010/07/access_20100721.log




------------------------------------------------------------------






二 :安装配置 Awstats




建立Software目录,下载Awstats源码,然后解压。



?

mkdir
-p /data0/software
cd
/data0/software
wget
http://ncu.dl.sourceforge.net/project/awstats/AWStats/7.0/awstats-7.0.tar.gz
tar
zxf awstats-7.0.tar.gz





检查Perl版本



?

perl
–version





执行 awstats-7.0/tools 目录中的 awstats_configure.pl 配置向导,创建统计。



?

perl
/data0/software/awstats-7.0/tools/awstats_configure.pl





因为用的是 Nginx,输入 none



?

----->
Check for web
server install
Enter
full config file path of your Web server.
Example:
/etc/httpd/httpd.conf
Example:
/usr/local/apache2/conf/httpd.conf
Example:
c:\Program files\apache group\apache\conf\httpd.conf
Config
file path ('none' to
skip web server setup):
#>
none





输入y,创建一个新的配置文件



?

Your
web server config file(s) could not be found.
You
will need to setup your web server manually to declare AWStats
scriptas a
CGI, if you
want to build reports dynamically.
See
AWStats setup documentation (file docs/index.html)
----->
Update model config file '/usr/local/awstats/wwwroot/cgi-bin/awstats.model.conf'
  File
awstats.model.conf updated.
----->
Need to create a new config
file ?
Do
you want me to build a new AWStats
config/profile
file
(required if first
install) [y/N] ?
#>
y





输入要统计的域名,(以www.tele6.me为例)



?

----->
Define config file name to create
Whatis the
name of your web site or profile analysis ?
Example:
www.mysite.com
Example:
demo
Your
web site, virtual server
or profile name:
#>
www.tele6.me





然后一路回车



?

----->
Define config file path
In
which directory do you
plan to store your config file(s) ?
Default:
/etc/awstats
Directory
path to store config file(s) (Enter for default):
#>
---->
Add update process inside a scheduler
Sorry,
configure.pl does not support automatic add to cron yet.
You
can do it
manually by adding the following command to your cron:
/data0/software/awstats-7.0/wwwroot/cgi-bin/awstats.pl
-update -config=www.tele6.me  

Orif you
have several config files and prefer having only one command:
/data0/software/awstats-7.0/tools/awstats_updateall.pl
now
Press
ENTER to continue...     
A
SIMPLE config file has been created: /etc/awstats/awstats.www.tele6.me.conf  

You
should have a look inside to check and change manually main parameters.
You
can then manually update your statistics for 'www.tele6.me' with
command:
>
perl awstats.pl -update -config=www.tele6.me
You
can also build static report
pages for 'www.tele6.me' with
command:
>
perl awstats.pl -output=pagetype -config=www.tele6.me
Press
ENTER to finish...





回车完成安装,然后修改awstats的配置文件:



?

vi
/etc/awstats/www.tele6.me.conf







查找文件中,修改 日志格式LogFormat 和 日志目录结构LogFile



?

LogFile="/data1/logs/%YYYY-24/%MM-24/access_%YYYY-24%MM-24%DD-24.log"
LogFormat
= "%host
%logname %time1 %methodurl %code %bytesd %refererquot %uaquot %other"





创建Awstats数据目录,生成静态文件的目录



?

mkdir
-p /var/lib/awstats
mkdir
-p /data0/htdocs/awstats              # --- web访问的目录





给部分需要执行的文件赋予权限(否则会出现 permission denied 的情况)



?

chown
root /data0/software/awstats-7.0/tools/awstats_buildstaticpages.pl
chmod
700  /data0/software/awstats-7.0/tools/awstats_buildstaticpages.pl
chmod
+x   /data0/software/awstats-7.0/tools/awstats_buildstaticpages.pl
chown
root /data0/software/awstats-7.0/wwwroot/cgi-bin/awstats.pl
chmod
700  /data0/software/awstats-7.0/wwwroot/cgi-bin/awstats.pl
chmod
+x   /data0/software/awstats-7.0/wwwroot/cgi-bin/awstats.pl





然后执行



?

1

/data0/software/awstats-7.0/tools/awstats_buildstaticpages.pl
-update -config=www.tele6.me -lang=cn -dir=/data0/htdocs/awstats/ -awstatsprog=/data0/software/awstats-7.0/wwwroot/cgi-bin/awstats.pl





这样,一切正常的话就会在  /data0/htdocs/awstats  目录中生成一系列静态文件


还需要把一些图片文件和js文件,copy到 /data0/htdocs/awstats 中 并赋予访问权限



?

cp
-a /data0/software/awstats-7.0/wwwroot/icon/ /data0/htdocs/awstats/icon/
cp
-a /data0/software/awstats-7.0/wwwroot/js/ /data0/htdocs/awstats/js/
chmod
-R 700 /data0/htdocs/awstats/icon
chmod
-R 700 /data0/htdocs/awstats/js





ls -lh 查看一下   /data0/htdocs/awstats   目录的情况,如下图:


DSC0000.jpg




完成了。


可以访问刚才生成在  /data0/htdocs/awstats  目录里的静态文件看看效果了。

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-144152-1-1.html 上篇帖子: AWStats 6.9发布: 补充中文搜索引擎定义和配置样例下载 下篇帖子: AWStats: 跨平台的日志分析工具使用简介
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表