dbcp基本配置和重连配置

最近在看一些dbcp的相关内容,顺便做一下记录,免得自己给忘记了。

1. 引入dbcp (选择1.4)

1.<dependency>
2.    <groupId>com.alibaba.external</groupId>
3.    <artifactId>jakarta.commons.dbcp</artifactId>
4.    <version>1.4</version>
5.</dependency>

2. dbcp的基本配置

相关配置说明:

 

  1. initialSize :连接池启动时创建的初始化连接数量(默认值为0)
  2. maxActive :连接池中可同时连接的最大的连接数(默认值为8,调整为20,高峰单机器在20并发左右,自己根据应用场景定)
  3. maxIdle:连接池中最大的空闲的连接数,超过的空闲连接将被释放,如果设置为负数表示不限制(默认为8个,maxIdle不能设置太小,因为假如在高负载的情况下,连接的打开时间比关闭的时间快,会引起连接池中idle的个数 上升超过maxIdle,而造成频繁的连接销毁和创建,类似于jvm参数中的Xmx设置)
  4. minIdle:连接池中最小的空闲的连接数,低于这个数量会被创建新的连接(默认为0,调整为5,该参数越接近maxIdle,性能越好,因为连接的创建和销毁,都是需要消耗资源的;但是不能太大,因为在机器很空闲的时候,也会创建低于minidle个数的连接,类似于jvm参数中的Xmn设置)
  5. maxWait  :最大等待时间,当没有可用连接时,连接池等待连接释放的最大时间,超过该时间限制会抛出异常,如果设置-1表示无限等待(默认为无限,调整为60000ms,避免因线程池不够用,而导致请求被无限制挂起)
  6. poolPreparedStatements:开启池的prepared(默认是false,未调整,经过测试,开启后的性能没有关闭的好。)
  7. maxOpenPreparedStatements:开启池的prepared 后的同时最大连接数(默认无限制,同上,未配置)
  8. minEvictableIdleTimeMillis  :连接池中连接,在时间段内一直空闲, 被逐出连接池的时间
  9. (默认为30分钟,可以适当做调整,需要和后端服务端的策略配置相关)
  10. removeAbandonedTimeout  :超过时间限制,回收没有用(废弃)的连接(默认为 300秒,调整为180)
  11. removeAbandoned  :超过removeAbandonedTimeout时间后,是否进 行没用连接(废弃)的回收(默认为false,调整为true)

removeAbandoned参数解释:

  1. 如果开启了removeAbandoned,当getNumIdle() < 2) and (getNumActive() > getMaxActive() - 3)时被触发.
  2. 举例当maxActive=20, 活动连接为18,空闲连接为1时可以触发"removeAbandoned".但是活动连接只有在没有被使用的时间超 过"removeAbandonedTimeout"时才被回收
  3. logAbandoned: 标记当连接被回收时是否打印程序的stack traces日志(默认为false,未调整)

一般会是几种情况出现需要removeAbandoned: 

  1. 代码未在finally释放connection , 不过我们都用sqlmapClientTemplate,底层都有链接释放的过程
  2. 遇到数据库死锁。以前遇到过后端存储过程做了锁表操作,导致前台集群中连接池全都被block住,后续的业务处理因为拿不到链接所有都处理失败了。

一份优化过的配置:

1.<bean id="dataSource" class="org.apache.commons.dbcp.BasicDataSource" destroy-method="close">
2.    <property name="driverClassName" value="com.mysql.jdbc.Driver" />
3.    <property name="url" value="xxxx" />
4.    <property name="username"><value>xxxx</value></property>
5.        <property name="password"><value>xxxxx</value></property>
6.        <property name="maxActive"><value>20</value></property>
7.        <property name="initialSize"><value>1</value></property>
8.        <property name="maxWait"><value>60000</value></property>
9.        <property name="maxIdle"><value>20</value></property>
10.        <property name="minIdle"><value>3</value></property>
11.        <property name="removeAbandoned"><value>true</value></property>
12.        <property name="removeAbandonedTimeout"><value>180</value></property>
13.        <property name="connectionProperties"><value>clientEncoding=GBK</value></property>
14.</bean>

2. dbcp的链接validate配置

  1. dbcp是采用了commons-pool做为其连接池管理,testOnBorrow,testOnReturn, testWhileIdle是pool是提供的几种校验机制,通过外部钩子的方式回调dbcp的相关数据库链接(validationQuery)校验
  2. dbcp相关外部钩子类:PoolableConnectionFactory,继承于common-pool PoolableObjectFactory
  3. dbcp通过GenericObjectPool这一入口,进行连接池的borrow,return处理
  4. testOnBorrow : 顾明思义,就是在进行borrowObject进行处理时,对拿到的connection进行validateObject校验
  5. testOnReturn : 顾明思义,就是在进行returnObject对返回的connection进行validateObject校验,个人觉得对数据库连接池的管理意义不大
  6. testWhileIdle : 关注的重点,GenericObjectPool中针对pool管理,起了一个Evict的TimerTask定时线程进行控制(可通过设置参数timeBetweenEvictionRunsMillis>0),定时对线程池中的链接进行validateObject校验,对无效的链接进行关闭后,会调用ensureMinIdle,适当建立链接保证最小的minIdle连接数。
  7. timeBetweenEvictionRunsMillis,设置的Evict线程的时间,单位ms,大于0才会开启evict检查线程
  8. validateQuery, 代表检查的sql
  9. validateQueryTimeout, 代表在执行检查时,通过statement设置,statement.setQueryTimeout(validationQueryTimeout)
  10. numTestsPerEvictionRun,代表每次检查链接的数量,建议设置和maxActive一样大,这样每次可以有效检查所有的链接.
    1.<property name="testWhileIdle"><value>true</value></property> <!-- 打开检查,用异步线程evict进行检查 -->
    2.    <property name="testOnBorrow"><value>false</value></property>
    3.    <property name="testOnReturn"><value>false</value></property>
    4.    <property name="validationQuery"><value>select sysdate from dual</value></property>
    5.    <property name="validationQueryTimeout"><value>1</value></property>
    6.    <property name="timeBetweenEvictionRunsMillis"><value>30000</value></property>
    7.    <property name="numTestsPerEvictionRun"><value>20</value></property>
    

相关配置需求:

  1. 目前网站的应用大部分的瓶颈还是在I/O这一块,大部分的I/O还是在数据库的这一层面上,每一个请求可能会调用10来次SQL查询,如果不走事务,一个请求会重复获取链接,如果每次获取链接都进行validateObject,性能开销不是很能接受,可以假定一次SQL操作消毫0.5~1ms(一般走了网络请求基本就这数)
  2. 网站异常数据库重启,网络异常断开的频率是非常低的,一般也就在数据库升级,演习维护时才会进行,而且一般也是选在晚上,访问量相对比较低的请求,而且一般会有人员值班关注,所以异步的validateObject是可以接受,但一个前提需要确保能保证在一个合理的时间段内,数据库能完成自动重联。

从代码层面简单介绍下dbcp的validate实现:

1.  common-pools提供的PoolableObjectFactory,针对pool池的管理操作接口

1.public interface PoolableObjectFactory {
2.
3.  Object makeObject() throws Exception;
4.
5.  void destroyObject(Object obj) throws Exception;
6.
7.  boolean validateObject(Object obj);
8.
9.  void activateObject(Object obj) throws Exception;
10.
11.  void passivateObject(Object obj) throws Exception;
12.}

2. dbcp实现的pool从池管理操作

 

这里贴了一个相关validate代码,具体类可见:PoolableConnectionFactory.validateConnection()

1.public class PoolableConnectionFactory implements PoolableObjectFactory {
2.
3.......
4.public boolean validateObject(Object obj) { //验证validateObject
5.        if(obj instanceof Connection) {
6.            try {
7.                validateConnection((Connection) obj);
8.                return true;
9.            } catch(Exception e) {
10.                return false;
11.            }
12.        } else {
13.            return false;
14.        }
15.    }
16.public void validateConnection(Connection conn) throws SQLException {
17.        String query = _validationQuery;
18.        if(conn.isClosed()) {
19.            throw new SQLException("validateConnection: connection closed");
20.        }
21.        if(null != query) {
22.            Statement stmt = null;
23.            ResultSet rset = null;
24.            try {
25.                stmt = conn.createStatement();
26.                if (_validationQueryTimeout > 0) {
27.                    stmt.setQueryTimeout(_validationQueryTimeout);
28.                }
29.                rset = stmt.executeQuery(query);
30.                if(!rset.next()) {
31.                    throw new SQLException("validationQuery didn't return a row");
32.                }
33.            } finally {
34.                if (rset != null) {
35.                    try {
36.                        rset.close();
37.                    } catch(Exception t) {
38.                        // ignored
39.                    }
40.                }
41.                if (stmt != null) {
42.                    try {
43.                        stmt.close();
44.                    } catch(Exception t) {
45.                        // ignored
46.                    }
47.                }
48.            }
49.        }
50.    }
51.
52.....
53.
54.}

3. pool池的evict调用代码:GenericObjectPool (apache commons pool version 1.5.4)

1.protected synchronized void startEvictor(long delay) { //启动Evictor为TimerTask
2.        if(null != _evictor) {
3.            EvictionTimer.cancel(_evictor);
4.            _evictor = null;
5.        }
6.        if(delay > 0) {
7.            _evictor = new Evictor();
8.            EvictionTimer.schedule(_evictor, delay, delay);
9.        }
10.    }
11.
12.for (int i=0,m=getNumTests();i<m;i++) {
13.            final ObjectTimestampPair pair;
14.           .......
15.            boolean removeObject = false;
16.            // 空闲链接处理
17.            final long idleTimeMilis = System.currentTimeMillis() - pair.tstamp;
18.            if ((getMinEvictableIdleTimeMillis() > 0) &&
19.                    (idleTimeMilis > getMinEvictableIdleTimeMillis())) {
20.                removeObject = true;
21.            } else if ((getSoftMinEvictableIdleTimeMillis() > 0) &&
22.                    (idleTimeMilis > getSoftMinEvictableIdleTimeMillis()) &&
23.                    ((getNumIdle() + 1)> getMinIdle())) {
24.                removeObject = true;
25.            }
26.            //  testWhileIdle sql 检查处理
27.            if(getTestWhileIdle() && !removeObject) {
28.                boolean active = false;
29.                try {
30.                    _factory.activateObject(pair.value);
31.                    active = true;
32.                } catch(Exception e) {
33.                    removeObject=true;
34.                }
35.                if(active) {
36.                    if(!_factory.validateObject(pair.value)) {
37.                        removeObject=true;
38.                    } else {
39.                        try {
40.                            _factory.passivateObject(pair.value);
41.                        } catch(Exception e) {
42.                            removeObject=true;
43.                        }
44.                    }
45.                }
46.            }
47.            // 真正关闭
48.            if (removeObject) {
49.                try {
50.                    _factory.destroyObject(pair.value);
51.                } catch(Exception e) {
52.                    // ignored
53.                }
54.            }
55.          ........

注意: 目前dbcp的pool的实现是使用了公用的apache common pools进行扩展处理,所以和原生的连接池处理,代码看上去有点别扭,感觉自动重连这块异常处理不怎么好,我也就只重点关注了这部分代码而已   .

 

3. dbcp的链接自动重链相关测试

相关场景:

  1. 数据库意外重启后,原先的数据库连接池能自动废弃老的无用的链接,建立新的数据库链接
  2. 网络异常中断后,原先的建立的tcp链接,应该能进行自动切换

测试需求1步骤

  1. 建立一testCase代码
  2. 配置mysql数据库
  3. 循环执行在SQL查询过程
  4. 异常重启mysql数据库

测试需求2步骤

  1. 建立一testCase代码
  2. 配置mysql数据库
  3. 循环执行在SQL查询过程
  4. 通过iptables禁用网络链接

/sbin/iptables -A INPUT -s 10.16.2.69 -j REJECT
/sbin/iptables -A FORWARD -p tcp -s 10.16.2.69 --dport 3306 -m state --state NEW,ESTABLISHED -j DROP

     5. iptables -F 清空规则,恢复链接通道。

 

测试需求问题记录

 

分别测试了两种配置,有validateObject的配置和没有validateObject的相关配置。

1. 没有validate配置
问题一: 异常重启mysql数据库后,居然也可以自动恢复链接,sql查询正常
跟踪了一下代码,发现这么一个问题:

  1. 在数据库关闭的时候,client中pool通过borrowObject获取一个异常链接返回给client
  2. client在使用具体的异常链接进行sql调用出错了,抛了异常
  3. 在finally,调用connection.close(),本意是应该调用pool通过returnObject返回到的池中,但在跟踪代码时,未见调用GenericObjectPool的returnObject
  4. 继续查,发现在dbcp在中PoolingDataSource(实现DataSource接口)调用PoolableConnection(dbcp pool相关的delegate操作)进行相应关闭时,会检查_conn.isClosed(),针对DataSource如果isClosed返回为true的则不调用returnObject,直接丢弃了链接  

解释:

  • 正因为在获取异常链接后,因为做了_conn.isClosed()判断,所以异常链接并没有返回到连接池中,所以到数据库重启恢复后,每次都是调用pool重新构造一个新的connection,所以后面就正常了
  • _conn.isClosed()是否保险,从jdk的api描述中: A connection is closed if the method close has been called on it or if certain fatal errors have occurred. 里面提供两种情况,一种就是被调用了closed方法,另一种就是出现一些异常也说的比较含糊。

问题二:validateObject调用时,dbcp设置的validationQueryTimeout居然没效果

看了mysql statement代码实现,找到了答案。 

mysql com.mysql.jdbc.statemen 部分代码

 

timeout时间处理:

1.timeoutTask = new CancelTask();
2.//通过TimerTask启动一定时任务
3.Connection.getCancelTimer().schedule(timeoutTask,  this.timeoutInMillis);

对应的CancelTask的代码: 

1.class CancelTask extends TimerTask {
2.
3.        long connectionId = 0;
4.
5.        CancelTask() throws SQLException {
6.            connectionId = connection.getIO().getThreadId();
7.        }
8.
9.        public void run() {
10.
11.            Thread cancelThread = new Thread() {
12.
13.                public void run() {
14.                    Connection cancelConn = null;
15.                    java.sql.Statement cancelStmt = null;
16.
17.                    try {
18.                        cancelConn = connection.duplicate();
19.                        cancelStmt = cancelConn.createStatement();
20.                                                // 简单暴力,再发起一条KILL SQL,关闭先前的sql thread id
21.                        cancelStmt.execute("KILL QUERY " + connectionId);
22.                        wasCancelled = true;
23.                    } catch (SQLException sqlEx) {
24.                        throw new RuntimeException(sqlEx.toString());
25.                    } finally {
26.                        if (cancelStmt != null) {
27.                            try {
28.                                cancelStmt.close();
29.                            } catch (SQLException sqlEx) {
30.                                throw new RuntimeException(sqlEx.toString());
31.                            }
32.                        }
33.
34.                        if (cancelConn != null) {
35.                            try {
36.                                cancelConn.close();
37.                            } catch (SQLException sqlEx) {
38.                                throw new RuntimeException(sqlEx.toString());
39.                            }
40.                        }
41.                    }
42.                }
43.            };
44.
45.            cancelThread.start();
46.        }
47.    }

原因总结一句话: queryTimeout的实现是通过底层数据库提供的机制,比如KILL QUERY pid.  如果此时的网络不通,出现阻塞现象,对应的kill命令也发不出去,所以timeout设置的超时没效果。

4.最后

最后还是决定配置testWhileIdle扫描,主要考虑:

  1. pool池中的链接如果未被使用,可以通过testWhileIdle进行链接检查,避免在使用时后总要失败那么一次,可以及时预防
  2. 配合连接池的minEvictableIdleTimeMillis(空闲链接),removeAbandoned(未释放的链接),可以更好的去避免因为一些异常情况引起的问题,防范于未然。比如使用一些分布式数据库的中间件,会有空闲链接关闭的动作,动态伸缩连接池,这时候需要能及时的发现,避免请求失败。
  3. testOnBorrow个人不太建议使用,存在性能问题,试想一下连接一般会在什么情况出问题,网络或者服务端异常终端空闲链接,网络中断你testOnBorrow检查发现不对再取一个链接还是不对,针对空闲链接处理异常关闭,可以从好业务端的重试策略进行考虑,同时配置客户端的空闲链接超时时间,maxIdle,minIdle等。
时间: 2024-10-01 08:09:58

dbcp基本配置和重连配置的相关文章

activemq-ActiveMQ的断线重连配置?

问题描述 ActiveMQ的断线重连配置? 请问这句话 failover:(tcp://127.0.0.1:61616) 应该在哪里怎样配置呢,刚开始学消息推送,希望能给点指导.

CssGaga安装配置:运行环境/下载/配置

文章简介:CssGaga安装配置:运行环境/下载/配置. 1. 安装Microsoft .NET Framework 3.5 下载 Microsoft .NET Framework 3.5 注:Windows Vista. Windows 7已集成 2. 下载CssGaga最新绿色版并解压到本地 CssGaga Download 3. 更改配置文件CssGaga.exe.config <!-- 本地路径 --> <add key="pathSource" value=

解决Windows 7旗舰版系统下打开office 2003显示配置进度及正在配置有妙招

  ps:office 2010/2013需要激活之后才能进行以下操作. 1.首先打开windows 7旗舰版开始菜单中中的所有程序,接着打开附件中的记事本并打开,将下面的内容复制到记事本; Windows Registry Editor Version 5.00 [HKEY_CURRENT_USERSoftwareMicrosoftOffice15.0WordOptions] "NoRereg"=dword:00000001 2.然后可以根据office版本修改版本数字代码,也就是修

如果是Leovo|EMC存储,硬盘配置方面应该怎么配置?

  故障现象: 如果是Leovo|EMC存储,硬盘配置方面应该怎么配置?有什么注意事项? 解决方案: 请参考以下说明: 1.VNX系列的存储前四块盘是系统盘,系统会占用前四块盘每块194GB的容量,在VNX2代存储上,系统容量占去了300GB,这部分容量对于用户不可用; 2.VNX存储出于数据安全的考虑,存储硬盘的每一个扇区为520字节,而并非传统的512字节,这就要求在容量换算时是要除以1040,而并非1024,这样也造成了一定容量的损失. VNX1代存储硬盘可用容量,可参考下面这张表格:

office 2003/2007/2010/2013配置进度、正在配置轻松解决

  准备:office 2010/2013需要激活之后才能进行以下操作. 1.将下面的内容复制到记事本,记事本在开始菜单>所有程序>附件. 1 2 3 Windows Registry Editor Version 5.00   [HKEY_CURRENT_USERSoftwareMicrosoftOffice15.0WordOptions]   "NoRereg"=dword:00000001 2.根据office版本修改版本数字代码,也就是修改"15.0&qu

.NET Core采用的全新配置系统[1]: 读取配置数据

提到"配置"二字,我想绝大部分.NET开发人员脑海中会立马浮现出两个特殊文件的身影,那就是我们再熟悉不过的app.config和web.config,多年以来我们已经习惯了将结构化的配置定义在这两个文件之中.到了.NET Core的时代,很多我们习以为常的东西都发生了改变,其中也包括定义配置的方式.总的来说,新的配置系统显得更加轻量级,并且具有更好的扩展性,其最大的特点就是支持多样化的数据源.我们可以采用内存的变量作为配置的数据源,也可以直接配置定义在持久化的文件甚至数据库中.由于很多

apache伪静态配置与iis伪静态配置的区别分析对比

apache伪静态配置与iis伪静态配置的区别分析对比 /* 在web开发中,经常会碰以要把php教程,asp教程文件伪静态成htm或其它文件,下面我们要讲一下关于apache伪静态规则与iis中伪静态规则的一些不同的部份了.下面我们先来看看apache伪静态的配置方法. 实例,我们要把 pl.php教程?id=1 page.php?id=1 伪静态成html页面 d-1.html v-1.html <virtualhost 192.168.0.110:801>     serveradmin

如何做到 Laravel 配置可以网站后台配置?

本文分享下利用 Laravel 的 Bootstrapping 达到网站后台设置 laravel 配置. 需求场景 首先,ThinkSNS+ 作为一个用户可以使用的「社交系统」和开源网站程序一样拥有后台,有一些配置,Laravel 是要求写在 /config/*.php 的配置文件中的,例如 app.name.app.debug 等信息的配置,以及 Jobs 的驱动配置,广播系统的配置等,我们都搬到了网站后台,用户安装后可以不用修改配置文件的情况下镜像配置. 如何覆盖配置 我们首先打开 Illu

系统-ubuntu网络配置,多网卡配置

问题描述 ubuntu网络配置,多网卡配置 我用ubuntu桌面版配置ubuntu双网卡双IP网络,想实现同时访问外网的功能(也就是同时被win系统ping通), 但是我2个ip只有一个网关,给eth2和eth3网卡同时设置网关只有eth2能访问外网,eth3不能 如果只给eth2设置网关还和上面一种情况一样,给eth3设置网关都不能访问外网了,前提是两块网卡 单独配置时候均能访问外网.我该怎么办啊~~~怎么实现同时访问外网呢~