能分析压缩的日志，且基于文件输入的PYTHON代码实现

确实感觉长见识了。

希望能坚持，并有多的时间用来分析这些思路和模式。

#!/usr/bin/python
import sys
import gzip
import bz2
from optparse import OptionParser

class LogProcessor(object):
    '''
    Process a combined log format.

    This processor handles log files in a combined format,
    objects that act on the results are passed in to
    the init method as a series of methods.
    '''
    def __init__(self, call_chain=None):
        """
        Setup parser
        Save the call chain. Each time we process a log ,
        we'll run the list of callbacks with the processed
        log results.
        """
        if call_chain is None:
            call_chain = []
        self._call_chain = call_chain
    def split(self, line):
            """
            Split a log file.
            Initially,we just want size and requested file name . so
            we'll split on spaces and pull the data out.
            """
            parts = line.split()

            return {
                'size': 0 if parts[9] == '-' else int(parts[9]),
                'file_requested': parts[6]
            }
    def parse(self, handle):
            """
            Parses the log file.
            Returns a dictionary composed of log entry values
            for easy data summation
            """
            for line in handle:
                fields = self.split(line)
                for func in self._call_chain:
                   func(fields)

class ColumnLogProcessor(LogProcessor):
    def split(self, line):
        parts = line.split()
        return {
            'size': int(parts[1]),
            'file_requested': parts[0]
        }

class MaxSizeHandler(object):
    """
    Check a file's size.
    """
    def __init__(self, size):
        self.size = size
    def process(self, fields):
        """
        Looks at each line individually.
        Looks at each parsed log line individually and
        performs a size calculation. If it's bigger than
        our self.size, we just print a warning.
        """
        if fields['size'] > self.size:
            #print ('Warning: %s exceeds $d bytes (%s) !' % (fields['file_requested'], str(self.size), fields['size']))
            print ('Warning: {0} exceeds {1} bytes {2} !'.format (fields['file_requested'], str(self.size), fields['size']))
def get_stream(path):
    """
    Detect compression.
    If the file name ends in a compression suffix, we'll open
    using the correct algorith. If not, we just return a standard
    file object.
    """
    _open = open
    if path.endswith(',gz'):
        _open = gzip.open
    elif path.endswith('.bz2'):
        _open = bz2.open()
    return _open(path)
if __name__ == '__main__':
    parser = OptionParser()
    parser.add_option('-s', '--size', dest = "size",
                      help = "Maximum File Size Allowed",
                      default = 0, type = "int")
    parser.add_option('-f', '--file', dest = "file",
                      help = "Path to Web Log File",default = "-")
    opts,args = parser.parse_args()
    call_chain = []

    if opts.file == '-':
        file_stream = sys.stdin
    else:
        try:
            #file_stream = open(opts.file, 'r')
            file_stream = get_stream(opts.file)
        except IOError as e:
            print (sys.stderr,str(e))
            sys.exit(-1)

    size_check = MaxSizeHandler(opts.size)
    call_chain.append(size_check.process)
    processor = LogProcessor(call_chain)
    processor.parse(file_stream)
    #processorC = ColumnLogProcessor(call_chain)
    #processorC.parse(file_stream)

时间： 2024-09-18 00:42:23

能分析压缩的日志，且基于文件输入的PYTHON代码实现的相关文章

MS SQL压缩数据库日志方法

数据|数据库|压缩企业管理器里面的方法:1.打开企业管理器2.打开要处理的数据库3.点击最上面菜单>工具>SQL查询分析器,打开SQL查询分析器4.在输入窗口里面输入: 程序代码: DUMP TRANSACTION [数据库名] WITH NO_LOGBACKUP LOG [数据库名] WITH NO_LOGDBCC SHRINKDATABASE([数据库名]) 点击绿色的小三角(或按F5)执行查询,等状态栏提示处理完成即可! 程序里面的方法:压缩数据库日志--1.清空日志exec('DUM

SQL2005 压缩清除日志及数据库文件大小

下面的所有库名都指你要处理的数据库的库名 1.清空日志打开查询分析器,输入命令DUMP TRANSACTION 数据库名 WITH NO_LOG2. 再打开企业管理器--右键你要压缩的数据库--所有任务--收缩数据库--收缩文件--选择日志文件--在收缩方式里选择收缩至XXM, 这里会给出一个允许收缩到的最小M数,直接输入这个数,确定就可以了. 代码如下复制代码 DUMP TRANSACTION 库名 WITH NO_LOG 2.截断事务日志: 代码如下

sql2005 日志清理 SQL2005压缩清除日志的方法_mssql2005

教你如何清除SQL日志 1．打开查询分析器,输入命令DUMP TRANSACTION 数据库名 WITH NO_LOG2. 再打开企业管理器--右键你要压缩的数据库--所有任务--收缩数据库--收缩文件--选择日志文件--在收缩方式里选择收缩至XXM, 这里会给出一个允许收缩到的最小M数,直接输入这个数,确定就可以了. 清除Log有两种方法: 1.自动清除法开放数据库选项 Trunc Log on Chkpt,使数据库系统每隔一段时间自动清除Log. 此方法的优点是无须人工干预, 由SQL S

关于实现一个基于文件持久化的EventStore的核心构思

大家知道enode框架的架构是基于ddd+event sourcing的思想.我们持久化的不是聚合根的最新状态,而是聚合根产生的领域事件.最近我在思考如何实现一个基于文件的eventstore.目标有两个: 1.必须要高性能: 2.支持聚合根事件的并发持久化,要确保单个聚合根实例不会保存版本号相同的事件: 事件持久化高性能经过了一番调研,发现用文件存储事件非常合适.要确保高性能,我们可以顺序写文件(append),然后随机读文件.之所以要随机读文件是因为在当某些command由于操作同一个聚合

Java核心技术卷I基础知识3.7.3　文件输入与输出

3.7.3 文件输入与输出要想对文件进行读取,就需要一个用File对象构造一个Scanner对象,如下所示: 如果文件名中包含反斜杠符号,就要记住在每个反斜杠之前再加一个额外的反斜杠: "c:\\mydirectory\\myf?ile.txt". 注释:在这里指定了UTF-8字符编码,这对于互联网上的文件很常见(不过并不是普遍适用).读取一个文本文件时,要知道它的字符编码--更多信息参见卷Ⅱ第2章.如果省略字符编码,则会使用运行这个Java程序的机器的"默

高可用日志探险——基于 Kubernetes 中的 ELK

本文讲的是高可用日志探险--基于 Kubernetes 中的 ELK[编者的话]本文主要讲述了作者的团队基于 Kubernetes 中的 ELK,构建高可用日志系统的实践,并总结一些过程中踩到的坑和一些对于从头开始搭建的建议,本文也是此系列文章的第一篇,后续文章可持续关注. [3 天烧脑式基于Docker的CI/CD实战训练营 | 北京站]本次培训围绕基于Docker的CI/CD实战展开,具体内容包括:持续集成与持续交付(CI/CD)概览:持续集成系统介绍:客户端与服务端的 CI/CD 实践:开

Access 中如何使用 ADO 來压缩或修复 MS Access 文件？

access|ado|压缩 Access 中如何使用 ADO 來压缩或修复 MS Access 文件?专题地址:http://access911.net/index.asp?board=4&recordid=71FAB71E 问题: Access 中如何使用 ADO 來压缩或修复 Microsoft Access 文件? 回答: 以前使用 DAO 时,Microsoft 有提供 CompactDatabase Method 來压缩 Microsoft Access 文件,RepairDat

如何使用ADO來压缩或修复Microsoft Access文件

以前使用 DAO 時,Microsoft 有提供 CompactDatabase Method 來压缩 Microsoft Access 文件,RepairDatabase Method 來修复损坏的 Microsoft Access 文件,.可是自从 ADO 出來之后,好像忘了提供相对的压缩及修复 Microsoft Access 文件的功能. 現在 Microsoft 发现了这个问题了,也提供了解決方法,不过有版本上的限制!限制說明如下: ActiveX Data Objects (ADO

实现基于文件存储的Session类

session 我没事的时候写的自主实现Session功能的类,基于文件方式存储Session数据,测试基本通过,还比较好玩,实际应用没有意义,只不过是学习Session是如何实现的. 一般基于文件存储Session数据效率不是很高,毕竟跟磁盘IO是有关系的,如果需要多台服务器共享数据,可以考虑使用NFS来存储数据,如果需要比较快的速度,可以考虑使用共享内存(shm)来保存数据,直接把Session数据存储路径指定为/dev/shm,这样磁盘IO会提高不少,不过shm空间比较小,一般Linux下

猜你喜欢

XML简介

xml 所谓的xml,就是eXtensible Markup Language, 翻译成中文就是"可扩展标识语言",在国内很多人理解xml为html的简单扩展,这实际上是一种误解. ...

java 学习笔记

笔记 JAVA的多线程一.线程基本概念将1个程序转换成多个独立运行的子任务.每个子任务都叫做一个线程. "进程"是指一种"自包容"的运行程序.有自己的地址空 ...

flash制作很出效果的韩国菜单

菜单做这个东西有点复杂但没有用到什么的AS 并且可以从中体会到韩国人有些动脑筋的地方最终效果文件下载原文件 MX版本,当然用2004更可以打开下载 1. 设置画布 780*105 针速六十 ...

.Net中常见问题及解决方法归类

解决|问题 VS2002到VS2003,又到今天的VS2005,给我们广大研发人员提供了极大的方便,但是里面也存在许多异常的错误,偶尔我们会为其所扰,就连微软内部人士也承认,有的异常错误至今尚未修复, ...

MS Sql Server 日志清理

server SET NOCOUNT ONDECLARE @LogicalFileName sysname,@MaxMinutes INT,@NewSize INTUSE grades -- 要操作的 ...

用PHP制作静态网站的模板框架(二)

PHP代码全部保存到单独的文件中,这个文件也就是由页面URL实际调用的文件.Web服务器通过PHP引擎解析该文件,然后把结果返回给浏览器.一般地,PHP代码总是动态地生成页面内容,比如查询数据库或者执 ...

用FrontPage建设自己的网站：网页的美化

frontpage|网页页面修整通过模板建立的网页,常常预先置放了些标题栏.目录栏(一般叫导航栏),导航栏都是用很多元素组成的,结构上稍稍复杂一些.一般情况下我们不必要对这些东西进行低层次的修改, ...

驱动方法不能改变任何事情

你曾听说过一名专业软件开发人员应该掌握一种驱动方法吗?这些驱动方法可能是:领域驱动设计(Domain-Driven Design).测试驱动开发(Test-Driven Development).行为 ...

URLEncoder的只编码中文字符的类

Java代码 package log; import java.io.UnsupportedEncodingException; import java.net.URLEncoder; import ...

应用之星移动应用开发操作教程

应用之星是免费的移动应用开发平台,同时是一个不需要借助程序员就可以独立开发的手机应用的平台. 应用之星平台是基于组件,图形化开发,无需编码技术,所见即所得,致力于解决应用开发门槛高.平台适配难.开发周 ...

巧用photoshop把偏暗照片调出唯美的、清新的、干净的色调

巧用photoshop把偏暗照片调出唯美的.清新的.干净的色调,让背景偏于蓝色,日系风格,让人物皮肤看起来更洁白的方法,简单粗暴,几步就可以完成,提供原图分类: PS调色教程

如何编写Python脚本替换文件中的多行字符？

问题描述解题思路代码实现 Python的特点 1.问题描述项目源码很大,属于C/C++混合的那种,编程风格也很多样,有'.c'.'.cc'.'cpp'.'.h'.'.hh'等文件.我要 ...

Photoshop给树林人物加上淡中性暖色调

效果图是比较低饱和度的暖色图片.调色的时候先把主色转为暖色,暗部及中间调部分转为较为中性的颜色.然后把整体调淡即可. 原图 <点小图查看大图> 最终效果 1.打开素材图片,创建可选颜色调整 ...

微软IE10 for Win7发布中文简体预览版

[科技讯]11月14日消息,在10月中旬,微软曾宣布将会为Win7用户提供IE10浏览器,随即将IE10 for Win7的发布下载页放置在官方网站上,虽然下载按钮无效,但还是让Win7用户们看到了希 ...

iOS中使用UIDatePicker制作时间选择器的实例教程_IOS

UIDatePicker的创建UIDatePicker是一个可以用来选择或者设置日期的控件,不过它是像转轮一样的控件,而且是苹果专门为日历做好的控件,如下图所示: 除了UIDatePicker控件,还 ...

示范如何使用windbg分析转储文件

对于上架的windows store应用程序,微软提供了反馈机制让用户在程序崩溃的时候可以自动上传迷你转储(mini dump)文件.这些dump文件对于分析用户遇到的问题是相当有帮助的,这里我就如何 ...

模块化与解耦

简述本文主要讲述了在iOS开发过程中,模块化工程架构的一种组织方式,本文主要讲述基于cocoapods来做模块化的方案,详细讲述了iOS开发怎么进行模块划分的内容,主要会在以下方面做阐述: 为什么要 ...

环信_ios 为什么在点击通讯录后跟好友聊天好，会话中不会有保存记录

问题描述解决方案彼此不是好友,只是通过username进行聊天的解决方案二:会保存.你用demo ChatListViewController的代码了? demo的逻辑是会删除非好友的conve ...

都市人群付费网上骂人

惨叫鸡随着现代生活节奏不断加快,工作压力大.学习负担重.抑郁情绪难消,逐渐成为都市人群普遍的心理困境.面对压力,有人会去看心理医生,但更多的人选择自我排解.最近,购买"发泄玩具" ...

【教程】解决Photoshop CS5序列号无效

用记事本编辑C:\WINDOWS\system32\drivers\etc目录下的hosts文件, 在末尾加上: 127.0.0.1 activate.adobe.com 127.0.0.1 prac ...

phonegap使用插件实现扫描二维码

问题描述 phonegap使用插件实现扫描二维码 phonegap使用插件实现扫描功能我什么环境插件都搞好了就是不能进行扫描请问这是为什么急急急希望你们能帮我谢谢 1.把所需要的.c ...

关于访问路径的问题~！

问题描述可是为什么出现系统找不到指定的文件...然后我用的是eclipse,视频里老师用的是myeclipse...目录结构不一样有点乱啊解决方案解决方案二:使用Thread.currentTh ...

请教一个正则表达式的写法

问题描述有如下的结构(从网上抓取的网页源文件):<h1>2014</h1><table><tr><td><strong>Nov ...

奇虎360正遭到来自苹果公司的“封杀”

摘要: 奇虎360(以下简称360)正遭到来自苹果公司的封杀. 昨日(2月6日),有网友爆料称,360多款iOS软件产品遭苹果一夜下架,其中包括360手机卫士.360口信.360浏览器HD.360电池 ...

大数据痛点 |《财经》封面报道

在政府和市场的双重催动下,那些原本封存在服务器里的陈年数据,成为一座座蕴藏丰富的"金矿".然而,能真正做深度挖掘的企业并不多,这一领域正在等待着"杀手级"应用的 ...

更好的指标、更好的云优先策略

对于具有大型复杂IT环境的CIO来说,云优先策略的风险和收益是一个难题.专家建议要使用显著的指标. 有些计算很容易:一家拥有几台运行几个现成应用的服务器的小型公司可以轻松计算出转移到云端的投资回报. ...

WordPress博客如何记录搜索引擎蜘蛛爬行痕迹

WordPress博客记录seo/seo.html" target="_blank">搜索引擎蜘蛛爬行痕迹插件: 1.搜索引擎蜘蛛爬行记录器Spider Track ...

网页优化必须做的26件事情

a)准备工作和建立内容在你注册域名之前,你就应该记录下你的想法,应该准备足够100个网页的内容.请注意是至少.这100个网页应该是真正的内容,而不是链接页,关于我们页,联系我们或者版权 ...

Flex4 DataGrid中如何嵌入RadioButton_Flex

复制代码代码如下: <s:DataGrid id="viewDg" width="100%" height="100%" fontF ...

server-helix服务器外部不能访问

问题描述 helix服务器外部不能访问我本机操作系统是windows8.1的,在vmware虚拟机上安装的系统是linux6.5 32位的. 我在虚拟机linux上安装了helix server 1 ...

热搜