应用系统日志采集解决方案(转)

概述


基于Flume + MongoDB,对现有的多个应用系统进行日志采集。

特点

  1. 采集范围
    每一次用户请求的请求信息。
  2. 数据量大
  3. 尽量减少现有系统的改动

数据流图


说明:

首先考虑的结构体系,是直接在应用系统中,将日志数据写到Flume;但是现有的应用系统都是非Maven的,需要在每一个应用系统中添加20+个jar包。为避免这种情况,抽出了一层日志服务,开放webservice服务给应用系统调用,最终形成上述的体系。

日志存储


1.需要解决的问题

1.1 借助Flume,写日志到MongoDB

参考:Flume学习应用:Java写日志数据到MongoDB

- 外网参考:Flume学习应用:Java写日志数据到MongoDB

1.2 发布webservice服务

参考:在web项目中发布jaxws

- 外网参考:在web项目中发布jaxws

2.日志服务实现

一个简单的web项目,对外发布一个webservice服务,实现写日志到Flume。

2.1 文件结构

src/main/java
    |---- cn.sinobest.asj.log
              |---- ISALog.java # 日志服务接口
              |---- SALogImpl.java # 日志服务实现类
    |---- cn.sinobest.asj.log.exception
              |---- InvalidGradeException.java # 表示无效的日志等级
              |---- InvalidFormatExceptioin.java # 表示无效的消息格式(要求是JSON格式字符串)
    |---- cn.sinobest.asj.log.util
              |---- ValidGrade.java # 枚举,所有有效的日志等级(DEBUG, INFO, WARN, ERROR)
              |---- MessageTemplate.java # 消息模板
src/main/resources
    |---- log4j.properties
src/main/webapp
    |---- WEB-INF
              |---- sun-jaxws.xml
              |---- web.xml
    |----  index.jsp # 这个可以忽略
pom.xml

 

2.2  文件内容

你可以直接从log-service拿到源代码,并跳过这一节的内容。

  1. pom.xml

     1 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
     2     xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/maven-v4_0_0.xsd">
     3     <modelVersion>4.0.0</modelVersion>
     4     <groupId>cn.sinobest.asj</groupId>
     5     <artifactId>log-service</artifactId>
     6     <packaging>war</packaging>
     7     <version>0.0.1-SNAPSHOT</version>
     8     <name>log-service Maven Webapp</name>
     9     <url>http://maven.apache.org</url>
    10     <dependencies>
    11         <dependency>
    12             <groupId>junit</groupId>
    13             <artifactId>junit</artifactId>
    14             <version>3.8.1</version>
    15             <scope>test</scope>
    16         </dependency>
    17         <dependency>
    18             <groupId>log4j</groupId>
    19             <artifactId>log4j</artifactId>
    20             <version>1.2.16</version>
    21         </dependency>
    22         <dependency>
    23             <groupId>commons-logging</groupId>
    24             <artifactId>commons-logging</artifactId>
    25             <version>1.1.1</version>
    26         </dependency>
    27         <!-- for log to Flume -->
    28         <dependency>
    29             <groupId>org.apache.flume.flume-ng-clients</groupId>
    30             <artifactId>flume-ng-log4jappender</artifactId>
    31             <version>1.6.0</version>
    32         </dependency>
    33         <!-- for jax-ws -->
    34         <dependency>
    35             <groupId>com.sun.xml.ws</groupId>
    36             <artifactId>jaxws-rt</artifactId>
    37             <version>2.2.10</version>
    38         </dependency>
    39         <!-- for test the log content is a json-format or not -->
    40         <dependency>
    41             <groupId>org.mongodb</groupId>
    42             <artifactId>mongo-java-driver</artifactId>
    43             <version>2.13.0</version>
    44         </dependency>
    45     </dependencies>
    46     <build>
    47         <finalName>log-service</finalName>
    48     </build>
    49 </project>

  2. web.xml

    <?xml version="1.0" encoding="UTF-8"?>
    <web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
             xmlns="http://java.sun.com/xml/ns/javaee"
             xmlns:web="http://java.sun.com/xml/ns/javaee/web-app_3_0.xsd"
             xsi:schemaLocation="http://java.sun.com/xml/ns/javaee http://java.sun.com/xml/ns/javaee/web-app_3_0.xsd"
             id="WebApp_ID" version="3.0" metadata-complete="false">
        <display-name>Archetype Created Web Application</display-name>
    </web-app>

    注意:如果是servlet3.0以下的版本,需要额外的配置。

  3. log4j.properties

    # 配置Log4jAppender,能写日志到Flume
    log4j.appender.flumeAvro=org.apache.flume.clients.log4jappender.Log4jAppender
    log4j.appender.flumeAvro.Hostname=localhost
    log4j.appender.flumeAvro.Port=44444
    log4j.appender.flumeAvro.UnsafeMode=true
    log4j.appender.flumeAvro.layout=org.apache.log4j.PatternLayout
    log4j.appender.flumeAvro.layout.ConversionPattern=%m
    # set root logger
    log4j.rootLogger=INFO, flumeAvro

  4. ISALog.java

    package cn.sinobest.asj.log;
    import javax.jws.WebParam;
    import javax.jws.WebService;
    import cn.sinobest.asj.log.exception.InvalidFormatExceptioin;
    import cn.sinobest.asj.log.exception.InvalidGradeException;
    /**
     * SINOBEST ASJ Log - 为实现日志的统一采集和管理.
     *
     * @author lijinlong
     *
     */
    @WebService
    public interface ISALog {
        /**
         * 日志记录.
         *
         * @param grade
         *            日志等级描述 - 忽略大小写.
         * @param content
         *            日志内容 - 需要为JSON格式的字符串.
         */
        public void log(@WebParam(name = "grade") String grade,
                @WebParam(name = "content") String content)
                throws InvalidGradeException, InvalidFormatExceptioin;
    }

  5. SALogImpl.java

      1 package cn.sinobest.asj.log;
      2 import javax.jws.WebService;
      3 import org.apache.commons.logging.Log;
      4 import org.apache.commons.logging.LogFactory;
      5 import cn.sinobest.asj.log.exception.InvalidFormatExceptioin;
      6 import cn.sinobest.asj.log.exception.InvalidGradeException;
      7 import cn.sinobest.asj.log.util.MessageTemplate;
      8 import cn.sinobest.asj.log.util.ValidGrade;
      9 import com.mongodb.util.JSON;
     10 @WebService(endpointInterface = "cn.sinobest.asj.log.ISALog")
     11 public class SALogImpl implements ISALog {
     12     static final Log log = LogFactory.getLog(SALogImpl.class);
     13     public void log(String grade, String content) throws InvalidGradeException,
     14             InvalidFormatExceptioin {
     15         checkGrade(grade);
     16         checkContent(content);
     17         ValidGrade vg = ValidGrade.valueOf(grade.toUpperCase());
     18         log(vg, content);
     19     }
     20     /**
     21      * 根据日志等级,调用{@link log}的不同方法记录日志.
     22      *
     23      * @param vg
     24      *            日志等级
     25      * @param content
     26      *            日志内容
     27      */
     28     private void log(ValidGrade vg, String content) {
     29         switch (vg) {
     30         case DEBUG:
     31             log.debug(content);
     32             break;
     33         case INFO:
     34             log.info(content);
     35             break;
     36         case WARN:
     37             log.warn(content);
     38             break;
     39         case ERROR:
     40             log.error(content);
     41             break;
     42         default:
     43             break;
     44         }
     45     }
     46     /**
     47      * 检查日志等级的有效性.
     48      *
     49      * @param grade
     50      *            日志等级描述.
     51      * @throws InvalidGradeException
     52      *             当日志等级无效时,抛出此异常.
     53      */
     54     private void checkGrade(String grade) throws InvalidGradeException {
     55         boolean valid = ValidGrade.isValid(grade);
     56         if (!valid) {
     57             String message = String.format(MessageTemplate.INVALID_GRADE,
     58                     grade, ValidGrade.getEnumContent());
     59             throw new InvalidGradeException(message);
     60         }
     61     }
     62     /**
     63      * 检查日志内容格式的有效性.<br>
     64      * 要求为JSON格式的字符串.
     65      *
     66      * @param content
     67      *            日志内容.
     68      * @throws InvalidFormatExceptioin
     69      *             当日志内容格式无效时,抛出此异常.
     70      */
     71     private void checkContent(String content) throws InvalidFormatExceptioin {
     72         boolean valid = true;
     73         if (content == null || content.isEmpty()) {
     74             valid = false;
     75         } else {
     76             try {
     77                 JSON.parse(content);
     78                 valid = true;
     79             } catch (com.mongodb.util.JSONParseException e) {
     80                 valid = false;
     81             }
     82         }
     83         if (!valid) {
     84             String message = String.format(MessageTemplate.INVALID_FORMAT,
     85                     content);
     86             throw new InvalidFormatExceptioin(message);
     87         }
     88     }
     89     /**
     90      * just for test.
     91      *
     92      * @param args
     93      */
     94     public static void main(String[] args) {
     95         String[][] data = { { "info", "{'name':'ljl','age':26}" },
     96                 { "INFO", "trouble is a friend." },
     97                 { "JOKE", "{'message':'I am feeling down.'}" } };
     98         ISALog ilog = new SALogImpl();
     99         for (String[] dat : data) {
    100             String grade = dat[0];
    101             String content = dat[1];
    102             try {
    103                 ilog.log(grade, content);
    104             } catch (Exception e) {
    105                 e.printStackTrace();
    106             }
    107         }
    108     }
    109 }

  6. InvalidGradeException.java

    package cn.sinobest.asj.log.exception;
    /**
     * 表示无效的日志等级.
     * @author lijinlong
     *
     */
    public class InvalidGradeException extends Exception {
        private static final long serialVersionUID = 1341726127995938030L;
        public InvalidGradeException(String message) {
            super(message);
        }
    }

  7. InvalidFormatExceptioin.java

    package cn.sinobest.asj.log.exception;
    /**
     * 表示无效的日志等级.
     * @author lijinlong
     *
     */
    public class InvalidGradeException extends Exception {
        private static final long serialVersionUID = 1341726127995938030L;
        public InvalidGradeException(String message) {
            super(message);
        }
    }

  8. ValidGrade.java

     1 package cn.sinobest.asj.log.util;
     2 /**
     3  * 有效的日志等级.
     4  *
     5  * @author lijinlong
     6  *
     7  */
     8 public enum ValidGrade {
     9     DEBUG, INFO, WARN, ERROR;
    10     /** 有效日志等级的枚举内容 */
    11     private static String enumContent;
    12     /**
    13      * 获取所有有效的日志等级.
    14      *
    15      * @return
    16      */
    17     public static String getEnumContent() {
    18         if (enumContent != null && !enumContent.isEmpty())
    19             return enumContent;
    20         ValidGrade[] vgs = ValidGrade.values();
    21         StringBuilder builder = new StringBuilder(30);
    22         for (ValidGrade vg : vgs) {
    23             builder.append(vg).append(",");
    24         }
    25         builder.delete(builder.length() - 1, builder.length());
    26         enumContent = builder.toString();
    27         return enumContent;
    28     }
    29
    30     /**
    31      * 判断日志等级是否有效.
    32      * @param grade 日志等级 - 忽略大小写.
    33      * @return
    34      */
    35     public static boolean isValid(String grade) {
    36         if (grade == null || grade.isEmpty())
    37             return false;
    38
    39         boolean result = false;
    40
    41         final String GRADE = grade.toUpperCase();
    42         ValidGrade[] vgs = ValidGrade.values();
    43         for (ValidGrade vg : vgs) {
    44             if (vg.toString().equals(GRADE)) {
    45                 result = true;
    46                 break;
    47             }
    48         }
    49
    50         return result;
    51     }
    52
    53     /**
    54      * just for test.
    55      * @param args
    56      */
    57     public static void main(String[] args) {
    58         String content = getEnumContent();
    59         System.out.println(content);
    60
    61         String[] testGrade = {"DEBUG", "INFO", "WARN", "ERROR", "TEST"};
    62         for (String tg : testGrade) {
    63             if (!ValidGrade.isValid(tg)) {
    64                 String message = String.format("%s is invalid.", tg);
    65                 System.out.println(message);
    66             }
    67         }
    68     }
    69 }

  9. MessageTemplate.java

    package cn.sinobest.asj.log.util;
    /**
     * 消息模板.
     * @author lijinlong
     *
     */
    public class MessageTemplate {
        /** 无效的消息等级 */
        public static final String INVALID_GRADE = "无效的日志等级[%s]。服务支持的日志等级有:%s。";
    
        /** 无效的消息内容格式 */
        public static final String INVALID_FORMAT = "无效的日志内容格式:\n%s\n,请检查是否为JSON格式的字符串。";
    }

  10. sun-jaxws.xml

    <?xml version="1.0" encoding="UTF-8"?>
    <endpoints xmlns="http://java.sun.com/xml/ns/jax-ws/ri/runtime"
        version="2.0">
        <endpoint name="defaultLog" implementation="cn.sinobest.asj.log.SALogImpl"
            url-pattern="/log.action" />
    </endpoints>

应用系统群


1.需要考虑的问题

1.1 拦截

使用Filter可以实现拦截。

1.2 组织日志内容

视需求而定,当前仅对request中的部分信息进行了采集。

1.3 格式化

日志信息需要格式化为JSON字符串,才能正确的写到MongoDB。

1.4 请求webservice服务

参考:基于wsimport生成代码的客户端

- 外网参考:基于wsimport生成代码的客户端

2. demo

2.1 文件结构图

src
 |---- cn.sinobest.asj.log
           |----  LogFilter.java
 |---- cn.sinobest.asj.log.wsimport # 存放wsimport生成的代码
           # 省略
basic
 |---- WEB-INF
           |---- web.xml

2.2 文件内容

  1. LogFilter.java

     1 package cn.sinobest.asj.log;
     2 import java.io.IOException;
     3 import java.net.MalformedURLException;
     4 import java.net.URL;
     5 import java.util.Date;
     6 import java.util.HashMap;
     7 import java.util.Map;
     8 import javax.servlet.Filter;
     9 import javax.servlet.FilterChain;
    10 import javax.servlet.FilterConfig;
    11 import javax.servlet.ServletException;
    12 import javax.servlet.ServletRequest;
    13 import javax.servlet.ServletResponse;
    14 import javax.servlet.http.HttpServletRequest;
    15 import org.apache.commons.logging.Log;
    16 import org.apache.commons.logging.LogFactory;
    17 import org.json.JSONObject;
    18 import cn.sinobest.asj.log.wsimport.ISALog;
    19 import cn.sinobest.asj.log.wsimport.InvalidFormatExceptioin_Exception;
    20 import cn.sinobest.asj.log.wsimport.InvalidGradeException_Exception;
    21 import cn.sinobest.asj.log.wsimport.SALogImplService;
    22 public class LogFilter implements Filter {
    23     static final Log log = LogFactory.getLog(LogFilter.class);
    24     static final String WSDL_LOCATION = "http://localhost:8080/logserv/log.action?wsdl";
    25     @Override
    26     public void destroy() {
    27     }
    28     @Override
    29     public void doFilter(ServletRequest request, ServletResponse response,
    30             FilterChain chain) throws IOException, ServletException {
    31         try {
    32             log(request);
    33         } catch (InvalidFormatExceptioin_Exception e) {
    34             e.printStackTrace();
    35         } catch (InvalidGradeException_Exception e) {
    36             e.printStackTrace();
    37         } finally {
    38             chain.doFilter(request, response);
    39         }
    40     }
    41     private void log(ServletRequest request) throws MalformedURLException,
    42             InvalidFormatExceptioin_Exception, InvalidGradeException_Exception {
    43         Map<String, Object> data = new HashMap<String, Object>();
    44         data.put("appid", "zfba");
    45         data.put("time", new Date());
    46         data.put("localAddr", request.getLocalAddr());
    47         data.put("localName", request.getLocalName());
    48         data.put("localPort", request.getLocalPort());
    49         data.put("remoteAddr", request.getRemoteAddr());
    50         data.put("remoteHost", request.getRemoteHost());
    51         data.put("remotePort", request.getRemotePort());
    52         // data.put("serverName", request.getServerName());
    53         // data.put("serverPort", request.getServerPort());
    54         HttpServletRequest hrequest = (HttpServletRequest) request;
    55         data.put("pathInfo", hrequest.getPathInfo());
    56         data.put("pathTranslated", hrequest.getPathTranslated());
    57         data.put("remoteUser", hrequest.getRemoteUser());
    58         data.put("requestURI", hrequest.getRequestURI());
    59         data.put("requestURL", hrequest.getRequestURL());
    60         data.put("servletPath", hrequest.getServletPath());
    61         JSONObject cont = new JSONObject(data);
    62         URL url = new URL(WSDL_LOCATION);
    63         SALogImplService ss = new SALogImplService(url);
    64         ISALog service = ss.getSALogImplPort();
    65         service.log("info", cont.toString());
    66     }
    67     @Override
    68     public void init(FilterConfig arg0) throws ServletException {
    69     }
    70 }

  2. web.xml
    这里仅贴出新增的内容:

        <!-- 测试日志 -->
        <filter>
            <filter-name>log-filter</filter-name>
            <filter-class>cn.sinobest.asj.log.LogFilter</filter-class>
        </filter>
        <!-- 测试日志 -->
        <filter-mapping>
            <filter-name>log-filter</filter-name>
            <url-pattern>/*</url-pattern>
        </filter-mapping>

测试


  1. 启动MongoDB
    参考《Flume学习应用:Java写日志数据到MongoDB》
  2. 配置并启动Flume
    参考《Flume学习应用:Java写日志数据到MongoDB》
  3. 启动日志服务
    参考《在web项目中发布jaxws》
  4. 启动应用系统,并进行访问
  5. 查看MongoDB数据库
    参考《Flume学习应用:Java写日志数据到MongoDB》

附录


相关文章

  1. Flume学习应用:Java写日志数据到MongoDB
    博客园:Flume学习应用:Java写日志数据到MongoDB
  2. 在web项目中发布jaxws
    博客园:在web项目中发布jaxws
  3. 基于wsimport生成代码的客户端博客园:基于wsimport生成代码的客户端

 

 

http://www.cnblogs.com/ywjy/p/5259291.html

 

时间: 2024-11-17 14:46:38

应用系统日志采集解决方案(转)的相关文章

intelligentminer数据仓库解决方案

当用户的数据积累到一定数量时,这些数据的某些潜在联系.分类.推导结果和待发现价值隐藏在其中,我们可以使用数据发掘工具帮助发现这些有价值的数据,ibm在这方面的工具就是intelligentminer.ibmintelligentminer被选为业界最佳数据采集工具,赢得了dm读者奖.除了数据仓库和数据挖掘解决方案,ibm还在此基础上开发了一系列行业解决方案及应用程序. 1.ibm数据挖掘工具 intelligentminer通过其世界领先的独有技术,例如典型数据集自动生成.关联发现.序列规律发现

如何在传输结构体数据的同时,完成结构体中变量数据的采集?

问题描述 最近在做一个项目,自己负责的主要工作是将定义好的结构体中的变量的数据传出来,以及matlab计算后传回来的数据进行解算并显示结构体1:传递初始化数据-没有问题结构体2:实时传递摇杆采集的数据-有问题结构体3:传递自动飞行数据-没有问题结构体4:接受matlab结算的数据,并进行显示(暂时还没有测试)现在遇到的问题,主要是:我需要实时传递摇杆采集的数据并传递出去这是按钮事件,当点击按钮之后开始传递结构体的数据SendUAV_ManualPilotpSendUAV_ManualPilot;

大家写个自动采集VeryCD标题的程序吧,好多励志,很不错

问题描述 大家写个自动采集VeryCD标题的程序吧,好多励志,很不错 解决方案 解决方案二:其实只要问那边站长要就可以了再说采集这个也麻烦,几天换一个,采集这种变化率很低的东西,还不如人力去采集解决方案三:up解决方案四:呵呵解决方案五:up解决方案六:几分钟就换好几个的解决方案七:恩,想想看啊,使用HttpWebRequest和HttpWebResponse在做页面的请求和下载,使用正则将<title></title>之间的数据取出来,分析这个要是一个最新的励志的话,存入数据库中

有没什么采集器能对口碑网数据进行采集

问题描述 有没什么采集器能对口碑网数据进行采集 解决方案 解决方案二: 采集新闻?去试下小孔子

《云安全原理与实践》——2.4 云计算安全设计原则

2.4 云计算安全设计原则 云计算作为一种新兴的信息服务模式,尽管会带来新的安全风险与挑战,但其与传统IT信息服务的安全需求并无本质区别,核心需求仍是对应用及数据的机密性.完整性.可用性和隐私性的保护.因此,云计算安全设计原则应从传统的安全管理角度出发,结合云计算自身的特点,将现有成熟的安全技术及机制延伸到云计算安全设计中,满足云计算的安全防护需求.2.4.1 最小特权最小特权原则是云计算安全中最基本的原则之一,它指的是在完成某种操作的过程中,赋予网络中每个参与的主体必不可少的特权.最小特权原则

VS2013 MVC5程序无法启动。各位帮忙看看怎么解决

问题描述 如图新创建的MVC5项目,未修改任何代码,直接F5调试,就出现这个了...是什么问题?怎么解决?刚升级的Update4,没升级之前是OK的 解决方案 解决方案二:设置位启动项目了?看看系统日志报的什么错.iisexpress没启动起来解决方案三:再不行就去控制面板->程序里面修复下VS解决方案四:引用1楼kongwei521的回复: 设置位启动项目了?看看系统日志报的什么错.iisexpress没启动起来 启动项目设置了.iisexpress启动了这个怎么看系统日志?解决方案五:换下端

数据采集过程中如何防止被遮蔽ip地址?

问题描述 采集数据被封ip该怎么办,如何判断出网站都用了哪些仿采集的程序?如何防止被遮蔽ip地址? 解决方案 解决方案二:采一次,换一个IP.解决方案三:亲,你的意思是循环换IP地址,那就是启用一个IP地址来存储识别调用,有没有更好的方案或者说具体流程该如何去设计呢?解决方案四:引用2楼csharp_3golden的回复: 亲,你的意思是循环换IP地址,那就是启用一个IP地址来存储识别调用,有没有更好的方案或者说具体流程该如何去设计呢? 那你只能模拟人的操作习惯,打开一个页面后过个几十秒,再打开

进销存 库存-正在做进销存管理,库存管理模块中,货架信息除了增删改查之外还需要什么方法?

问题描述 正在做进销存管理,库存管理模块中,货架信息除了增删改查之外还需要什么方法? 正在做进销存管理,库存管理模块中,货架信息除了增删改查之外还需要什么方法? 解决方案 库存盘点,对库存进行人工审计之后与系统中的数量进行比对,可以发现是否存在不一致,或者发现库存中有货品损坏则,应该进行一个损益,进行金额的损益计算.同时将数据库中的库存数量进行更新.大概就这些吧,我自己之前也做过.如果还想做得更加详细的话,需要到超市进行实际的需求采集 解决方案二: 增删改查 这就已经包扩了所有,任何项目的模块也

大数据“矿工” 世界上最艰辛的IT人

矿工,应该是这个世界上最辛苦的工人!这让笔者不经联想到,一个月以前,在风风火火的"2016贵阳数博会"上,总理又给中国市场指出了一块新"矿源"--大数据. 大数据"矿工"世界上最艰辛的IT人 "那么问题来了,大数据矿工,你的艰辛别人知道吗?"或许曾今,凑热闹的我们只关注绚丽的数据可视化效果.炫酷的用户画像模型,期待着数据支撑决策后的指点江山--可是,最基础的数据怎么来?城市规划专家曾讲,"我国现阶段城市人口最基础真实