Python把Nginx日志保存到MySQL数据库

Nginx access日志格式如下:

 代码如下 复制代码

#使用的nginx默认日志格式$remote_addr - $remote_user [$time_local] "$request" $status $body_bytes_sent "$http_referer" "$http_user_agent" "$http_x_forwarded_for"'

Nginx access 日志内容如下:

 代码如下 复制代码

182.19.31.129 - - [2013-08-13T00:00:01-07:00] "GET /css/anniversary.css HTTP/1.1" 304 0 "http://www.chlinux.net/" "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/28.0.1500.95 Safari/537.36" "-"

下面是Python 分析nginx的Python代码:

 代码如下 复制代码
#!/usr/bin/env python
#coding:utf8
import os
import fileinput
import re
import sys
import MySQLdb
 
#日志的位置
logfile=open("access_20130812.log")
 
'''使用的nginx默认日志格式$remote_addr - $remote_user
[$time_local] "$request" $status $body_bytes_sent
"$http_referer" "$http_user_agent" "$http_x_forwarded_for"'''
 
 
 
#日志分析正则表达式
#203.208.60.230
ipP = r"?P<ip>[d.]*"
 
'''以[开始,除[]以外的任意字符 防止匹配上下个[]项目
(也可以使用非贪婪匹配*?) 不在中括号里的.可以匹配换行外的任意字符
*这样地重复是"贪婪的“ 表达式引擎会试着重复尽可能多的次数。#以]结束'''
#[21/Jan/2011:15:04:41 +0800]
timeP = r"""?P<time>[[^[]]*]"""
 
'''以"开始, #除双引号以外的任意字符 防止匹配上下个""项目
(也可以使用非贪婪匹配*?),#以"结束'''
#"GET /EntpShop.do?method=view&shop_id=391796 HTTP/1.1"
#"GET /EntpShop.do?method=view&shop_id=391796 HTTP/1.1"
requestP = r"""?P<request>"[^"]*""""
 
statusP = r"?P<status>d+"
 
bodyBytesSentP = r"?P<bodyByteSent>d+"
 
'''以"开始, 除双引号以外的任意字符 防止匹配上下个""项目
(也可以使用非贪婪匹配*?),#以"结束'''
#"http://test.myweb.com/myAction.do?method=view&mod_id=&id=1346"
referP = r"""?P<refer>"[^"]*""""
 
'''以"开始, 除双引号以外的任意字符 防止匹配上下个""项目
(也可以使用非贪婪匹配*?),以"结束'''
'''"Mozilla/5.0 (compatible; Googlebot/2.1;
+http://www.google.com/bot.html)"''''
userAgentP = r"""?P<userAgent>"[^"]*""""
 
'''以(开始, 除双引号以外的任意字符 防止匹配上下个()
项目(也可以使用非贪婪匹配*?),以"结束'''
'''(compatible; Googlebot/2.1;
+http://www.google.com/bot.html)"''''
userSystems = re.compile(r'([^()]*)')
 
'''以"开始,除双引号以外的任意字符防止匹配上下个""项目
(也可以使用非贪婪匹配*?),以"结束'''
userlius = re.compile(r'[^)]*"')
 
#原理:主要通过空格和-来区分各不同项目,各项目内部写各自的匹配表达式
nginxLogPattern = re.compile(r"
(%s) - - (%s) (%s) (%s) (%s) (%s) (%s)"
%(ipP, timeP, requestP, statusP, bodyBytesSentP,
referP, userAgentP), re.VERBOSE)
 
#数据库连接信息
conn=MySQLdb.connect(host='192.168.1.22',
user='test',passwd='pass'
,port=3306,db='python')
cur=conn.cursor()
sql = "INSERT INTO python.test VALUES
(%s,%s,%s,%s,%s,%s,%s,%s,%s)"
 
while True:
line = logfile.readline()
if not line:break
matchs = nginxLogPattern.match(line)
 
if matchs != None:
allGroup = matchs.groups()
ip = allGroup[0]
time = allGroup[1]
request = allGroup[2]
status = allGroup[3]
bodyBytesSent = allGroup[4]
refer = allGroup[5]
userAgent = allGroup[6]
Time = time.replace('T',' ')[1:-7]
 
if len(userAgent) > 20:
userinfo = userAgent.split(' ')
userkel = userinfo[0]
try:
usersystem = userSystems.findall(userAgent)
usersystem = usersystem[0]
print usersystem
userliu = userlius.findall(userAgent)
 
value = [ip,Time,request,status,
bodyBytesSent,refer,userkel,usersystem,userliu[1]]
conn.commit()
print value
 
except IndexError:
userinfo = userAgent
value = [ip,Time,request,status,
bodyBytesSent,refer,userinfo,"",""]
else:
useraa = userAgent
value = [ip,Time,request,status,
bodyBytesSent,refer,useraa,"",""]
try:
result = cur.execute(sql,value)
#conn.commit()
print result
except MySQLdb.Error,e:
print "Mysql Error %d: %s" % (e.args[0], e.args[1])
conn.commit()
conn.close()

存入数据库后数据是如下格式:

时间: 2024-12-24 20:44:06

Python把Nginx日志保存到MySQL数据库的相关文章

就是刚出来工作 经理今天安排了个任务 大致就是用NHibernate技术把从页面获得的数据保存到MYSQL数据库

问题描述 就是刚出来工作经理今天安排了个任务大致就是用NHibernate技术把从页面获得的数据保存到MYSQL数据库,给了时限半个月,有没有好心的大神帮帮我啊,这个技术一无所知,谢谢了 解决方案 解决方案二:我们从来瞧不上NHibernate,累赘得会死人的.要访问MySQL,读写一堆.net对象,直接写sql语句与之交互就行了.不用学习半个月,最多2天半就行了.解决方案三:建议你先把数据写到MySQL数据库中(创建1.2个数据表来保存你的数据),然后再开始考虑NHibernate.解决方案四

java bigdecimal保存到mysql数据库不保留小数点后位数问题

问题描述 java bigdecimal保存到mysql数据库不保留小数点后位数问题 单元测试执行insert方法: set值如下: sp.setMaximumDd(new BigDecimal("-0.1109")); sp.setWinningPct(new BigDecimal("0.6217")); sp.setWinningMonth(new BigDecimal("0.80")); 插入到mysql数据库中值为什么变成了这样: ![图

php怎么把session保存到MySql数据库中

php中session默认的存储方式是硬盘,php也可以改变默认的存储方式. 主要使用到session_set_save_handler方法,下面分享下如何将session保存到MySql数据库中的具体代码. 1.建session表  代码如下 复制代码 CREATE TABLE `session` (   `sessionid` varchar(128) NOT NULL,   `uid` int(11) NOT NULL,   `data` mediumblob NOT NULL,   `t

Python 分析Nginx访问日志并保存到MySQL数据库实例_python

使用Python 分析Nginx access 日志,根据Nginx日志格式进行分割并存入MySQL数据库.一.Nginx access日志格式如下: 复制代码 代码如下: $remote_addr - $remote_user [$time_local] "$request" $status $body_bytes_sent "$http_referer" "$http_user_agent" "$http_x_forwarded_f

php中使用session_set_save_handler()函数把session保存到MySQL数据库实例_php实例

PHP保存session默认的是采用的文件的方式来保存的,这仅仅在文件的空间开销很小的windows上是可以采用的,但是如果我们采用uinx或者是liux上的文件系统的时候,这样的文件系统的文件空间开销是很大的,然而session是要时时刻刻的使用的,大量的用户就要创建很多的session文件,这样对整个的服务器带来性能问题. 另一方面,如果服务器起采用群集的方式的话就不能保持session的一致性,所以我们就绪要采用数据库的方式来保存session,这样,不管有几台服务器同时使用,只要把他们的

php中把session保存到MySQL数据库中示例

PHP保存session默认的是采用的文件的方式来保存的,这仅仅在文件的空间开销很小的windows上是可以采用的,但是如果我们采用uinx或者是liux上的文件系统的时候,这样的文件系统的文件空间开销是很大的,然而session是要时时刻刻的使用的,大量的用户就要创建很多的session文件,这样对整个的服务器带来性能问题. 另一方面,如果服务器起采用群集的方式的话就不能保持session的一致性,所以我们就绪要采用数据库的方式来保存session,这样,不管有几台服务器同时使用,只要把他们的

php 文本文件操作读取txt文件保存到mysql数据库

实例1.php 读txt文件插入数据库  代码如下 复制代码 <?php $m = mysql_connect('127.0.0.1','root','') or die("Invalid query: " . mysql_error()); mysql_select_db('discuz', $m) or die("Invalid query: " . mysql_error()); $handle = fopen("aa.txt", &

php 把图片以二进制形式保存到mysql数据库

$errmsg = "" ; if (! @ mysql_connect ( "localhost" , "trainee" , "abc123" )) { $errmsg = "Cannot connect to database" ; } @ mysql_select_db ( "wellho" ); // First run ONLY - need to create table

php上传文件并存储到mysql数据库的方法

 这篇文章主要介绍了php上传文件并存储到mysql数据库的方法,以完整实例形式较为详细的分析了php操作文件上传与数据库存储的技巧,具有一定参考借鉴价值,需要的朋友可以参考下     本文实例讲述了php上传文件并存储到mysql数据库的方法.分享给大家供大家参考.具体分析如下: 下面的代码分别用于创建mysql表和上传文件保存到mysql数据库 创建mysql表: ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 <?php $con = mysql_connect(&quo