Apache日志的一些操作命令技巧_Linux

假设apache日志格式为:

118.78.199.98 – - [09/Jan/2010:00:59:59 +0800] “GET /Public/Css/index.css HTTP/1.1″ 304 – “http://www.a.cn/common/index.php”
“Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; GTB6.3)”

问题1:在apachelog中找出访问次数最多的10个IP。

awk '{print $1}' apache_log |sort |uniq -c|sort -nr|head -n 10
awk 首先将每条日志中的IP抓出来,如日志格式被自定义过,可以 -F 定义分隔符和 print指定列;
sort进行初次排序,为的使相同的记录排列到一起;
upiq -c 合并重复的行,并记录重复次数。
head进行前十名筛选;
sort -nr按照数字进行倒叙排序。

我参考的命令是:
显示10条最常用的命令

 

复制代码 代码如下:

sed -e "s/| /n/g" ~/.bash_history | cut -d ' ' -f 1 | sort | uniq -c | sort -nr | head

问题2:在apache日志中找出访问次数最多的几个分钟。

复制代码 代码如下:

awk '{print  $4}' access_log |cut -c 14-18|sort|uniq -c|sort -nr|head

awk 用空格分出来的第四列是[09/Jan/2010:00:59:59;
cut -c 提取14到18个字符 -- 00:59
剩下的内容和问题1类似。

问题3:在apache日志中找到访问最多的页面:

复制代码 代码如下:

awk '{print $11}' apache_log |sed 's/^.*cn(.*)"/1/g'|sort |uniq -c|sort -rn|head

类似问题1和2,唯一特殊是用sed的替换功能将”http://www.a.cn/common/index.php”替换成括号内的内容:”http://www.a.cn(/common/index.php)”

问题4:在apache日志中找出访问次数最多(负载最重)的几个时间段(以分钟为单位),然后在看看这些时间哪几个IP访问的最多?

1,查看apache进程:

复制代码 代码如下:

ps aux | grep httpd | grep -v grep | wc -l    // ps aux是显示所有进程和其状态。

2,查看80端口的tcp连接:

复制代码 代码如下:

netstat -tan | grep "ESTABLISHED" | grep ":80" | wc -l

3,通过日志查看当天ip连接数,过滤重复:

复制代码 代码如下:

cat access_log | grep "19/May/2011" | awk '{print $2}' | sort | uniq -c | sort -nr

4,当天ip连接数最高的ip都在干些什么(原来是蜘蛛):

复制代码 代码如下:

cat access_log | grep "19/May/2011:00" | grep "61.135.166.230" | awk '{print $8}' | sort | uniq -c | sort -nr | head -n 10

5,当天访问页面排前10的url:

复制代码 代码如下:

cat access_log | grep "19/May/2010:00" | awk '{print $8}' | sort | uniq -c | sort -nr | head -n 10

6,用tcpdump嗅探80端口的访问看看谁最高

复制代码 代码如下:

tcpdump -i eth0 -tnn dst port 80 -c 1000 | awk -F"." '{print $1"."$2"."$3"."$4}' | sort | uniq -c | sort -nr

接着从日志里查看该ip在干嘛:

复制代码 代码如下:

cat access_log | grep 220.181.38.183| awk '{print $1"t"$8}' | sort | uniq -c | sort -nr | less

7,查看某一时间段的ip连接数:

复制代码 代码如下:

grep "2006:0[7-8]" www20110519.log | awk '{print $2}' | sort | uniq -c| sort -nr | wc -l

8,当前WEB服务器中联接次数最多的20条ip地址:

复制代码 代码如下:

netstat -ntu |awk '{print $5}' |sort | uniq -c| sort -n -r | head -n 20

9,查看日志中访问次数最多的前10个IP

复制代码 代码如下:

cat access_80_log |cut -d ' ' -f 1 |sort |uniq -c | sort -nr | awk '{print $0 }' | head -n 10 |less

10,查看日志中出现100次以上的IP

复制代码 代码如下:

cat access_log |cut -d ' ' -f 1 |sort |uniq -c | awk '{if ($1 > 100) print $0}'|sort -nr |less

11,查看最近访问量最高的文件

复制代码 代码如下:

cat access_log |tail -10000|awk '{print $7}'|sort|uniq -c|sort -nr|less

12,查看日志中访问超过100次的页面

复制代码 代码如下:

cat access_log | cut -d ' ' -f 7 | sort |uniq -c | awk '{if ($1 > 100) print $0}' | less

13,列出传输时间超过 30 秒的文件

复制代码 代码如下:

cat access_log|awk '($NF > 30){print $7}'|sort -n|uniq -c|sort -nr|head -20

14,列出最最耗时的页面(超过60秒的)的以及对应页面发生次数

复制代码 代码如下:

cat access_log |awk '($NF > 60 && $7~/.php/){print $7}'|sort -n|uniq -c|sort -nr|head -100

以上是小编为您精心准备的的内容,在的博客、问答、公众号、人物、课程等栏目也有的相关内容,欢迎继续使用右上角搜索按钮进行搜索日志
apache
linux apache 日志、linux查看apache日志、linux apache日志路径、linux apache访问日志、linux apache错误日志,以便于您获取更多的相关知识。

时间: 2024-08-03 18:53:36

Apache日志的一些操作命令技巧_Linux的相关文章

Apache日志管理和统计分析知识_Linux

 对于所有公司或icp来说,在保证网站稳定正常运行外,还需要了解网站访问量和分析报表,这对于了解和监控网站的运行状态,对于提高网站的服务能力和服务水平似乎必不可少的.通过对web服务器的日志文件进行分析和统计,能够有效的掌握系统运行的情况及站点内容的被访问情况,加强对整个站及其内容的维护与管理: Apache服务器具备强大的日志功能,管理员可以方便.准备.及时地了解服务器状况:可以更好地防范黑客的攻击. Apache规定了4类日志,分别为:错误日志.访问日志.传输日志以及Cookie日志.其中A

Linux下的Apache与PHP安全设置技巧_Linux

(1) safe_mode: 以安全模式运行php; 在php.ini文件中使用如下 safe_mode = On (使用安全模式) safe_mode = Off (关闭安全模式) 在apache的httpd.conf中VirtualHost的相应设置方法 php_admin_flag safe_mode On (使用安全模式) php_admin_flag safe_mode Off (关闭安全模式) 或者: php_admin_value safe_mode 1 (使用安全模式) php_

Shell脚本实现apache日志中的状态码分析_linux shell

一.首先将apache日志按天切割 复制代码 代码如下:        vi /etc/httpd/conf/httpd.conf         ErrorLog "|rotatelogs /var/log/httpd/%Y%m%derror_log 86400 480"        CustomLog "|rotatelogs /var/log/httpd/%Y%m%daccess_log 86400 480" combined 二.重启apache服务 复制

使用CDN之后APACHE日志记录中IP地址不正确的解决方案_Linux

最近在搞APACHE日志分析,装好了awstats之后,这两天进行了观察, 报表日期 月 1 月 2010 首次参观日期 2010年01月12日 11:04 最近参观日期 2010年01月13日 23:59     参观者 参观人次 网页数 文件数 字节 浏览器流量 * 77  226  (2.93 参观人次/参观者) 508979 (2252.11 网页数/参观) 509492 (2254.38 文件数/参观) 13.67 G字节 (63430.28 K字节/参观) 非浏览器流量 *  117

Linux下apache日志分析与状态查看方法_Linux

假设apache日志格式为:118.78.199.98 – - [09/Jan/2010:00:59:59 +0800] "GET /Public/Css/index.css HTTP/1.1″ 304 – "http://www.a.cn/common/index.php" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; GTB6.3)" 问题1:在apachelog中找出访问次数最多的1

命令行下Apache日志统计举例

原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 .作者信息和本声明.否则将追究法律责任.http://chenguang.blog.51cto.com/350944/1414820 Apache日志统计举例 加些来了解一下如何统计Apache的访问日志,一般可以用tail命令来实时查看日志文件变化,但是各种的应用系统中的日志会非常复杂,一堆长度超过你浏览极限的日志出现在你眼前时,你会觉得非常无奈,怎么办呢?这时可以用grep.sed.awk和sort等筛选工具帮助你解决这个问题.

监控apache日志的两个工具

监控apache日志的两个工具 apache日志分析工具webalizer      awstat 准备webalizer-2.23-05-src.tgz         awstats-7.0.tar.gz        Perl-5.16.3.1603.tar.gz 安装apache [root@lly ~]# mkdir /mnt/cdrom [root@lly ~]# mount /dev/cdrom  /mnt/cdrom挂载光驱 [root@lly ~]# cd /mnt/cdrom

企业shell脚本分析及切割apache日志实战

一,分析apache日志 1,有一个文件shell.sh,内容如下: [root@test3root]#catshell.sh http://www.baidu.com/index.html http://www.google.com/index.html http://www.baidu.com/get.html http://www.baidu.com/set.html http://www.google.com/index.html http://www.yahoo.com.cn/put.

Apache日志文件的正则表达式解析

Apache日志文件的正则表达式解析 2010-06-22 16:52 by Register, 511 阅读, 0 评论, 收藏, 编辑 使用正则表达式分隔Apache日志文件 通用日志格式的Apache日志文件示例: 127.0.0.1 - frank [10/Oct/2000:13:55:36 -0700] "GET /apache_pb.gif HTTP/1.0" 200 2326 组合日志格式的Apache日志文件示例: 127.0.0.1 - frank [10/Oct/2