经典案例:如何优化Oracle使用DBlink的SQL语句

一般在DBLINK的SQL语句中,将调用远程表的in-line view结果集返回的数据尽量减少,进而达到通过网络传输的数据减少的目的,而且也不会将数据传输的资源消耗在大量的网络等待事件上。在Oracle中这样的等待事件是:SQL*Net message from DBLINK

正巧,前段时间我们的Oracle生产库正好也碰到了这样的几条类似的SQL。所以,今天向大家分享一下,一次针对Oracle中使用DBLINK的SQL语句的优化思路分析过程。

发现问题

首先从EMCC监控上,发现一条SQL语句执行好长时间没有执行完毕。

问题解析(一)

根据其SQL_ID的值抓取出的SQL完整语句如下所示:

发现上面的SQL语句里有一个绑定变量":1"。

通过视图v$sql_bind_capture(或者dba_hist_sqlbind)进行查看具体的值。

或者也可以用SQLT(全称SQLTXPLAIN,关于SQLT的下载、安装和使用,请看Oracle MOS 215187.1)生成分析SQL_ID为83gn36c1fu9dw的报告,从报告中找出绑定变量”:1”具体的值(可能有很多),由于我的数据库服务器上已经部署了SQLT,生成报告的过程这里略过,查看绑定变量值的过程如下图所示。

然后,将上面查出的值”ff80808141c605e20141c9691f5a000c”带入原始的SQL语句并在SQL*Plus里执行,运行5分26秒才显示查询结果。可想而知,在当前的高并发情况下,这样的一条SQL语句花很长时间执行不完也就不足为奇了,整个过程如下图所示。

分析整个SQL语句的结构

其中最外层的SELECT是一个ROWNUM操作,也就是取内层结果集并返回前5行;

再往里的一层完全可以去掉,(这个我经过测试是可行的);

再往里看的一层就是内联视图r (查询远程表sd_res_id_case返回的结果集)与本地表t进行左联接;

最终返回整个查询结果。

大家仔细看一下那个内联视图r,你会发现里面还有一个子查询(就是and rowid in下面的那层)。

生成带统计信息的执行计划,如下图所示:

看第3步的NESTED LOOPS,Starts*E-Rows=1*2=2,而A-Rows=926K,我们说Starts*E-Rows的值和A-Rows的值应该相等或者相差不多,再看第8行的REMOTE,Starts*E-Rows=926K*3,A-Rows=5,这两个值也相差很大。而且这个REMOTE的Starts是926K,这说明要执行这么多次,这个太消耗资源而且还是在远程库的表上。

接下来,在执行计划后面的”Remote SQL Information”中可以看出有两个REMOTE操作,也就是说这条SQL语句的内联视图r并不是整体从远程表上查询出结果再返回到本地库,而是先执行第5步,再执行第8步,总共查询了两次远程表。

那么试想一下看能不能让远程表只查询一次,也就是让内联视图r只执行一次就返回远程表sd_res_id_case的查询结果?

结果当然是可以的,用一个no_merge的Hint放在内联视图r的第一个select 之后,更改之后是下面这样的:

竟然发现大约7秒就查询出结果,如下图所示,

接着,查看附加统计信息的执行计划。

最主要的是,执行时间大大降低,而且在执行计划里只有一个REMOTE操作,第二步变成了HASH JOIN操作(原先的执行计划是NESTED LOOPS),估计行和返回行都是5。

接下来再看第5行的VIEW操作,执行1次,估行行为5754,实际行为66165,这个相差10倍左右,估计还有优化的空间。

远程库上查看内联视图r的数据量

由于远程表的执行计划在本地库上无法查看,那么我们到远程库上查询一下原SQL语句的内联视图r,看看到底有多少数据。

在远程库上做如下操作。

竟然返回196372(约196K)行,这个值高的超乎我想象。

查看带统计信息的执行计划,如下图所示,

第2行的”NESTED LOOPS”操作实际返回行196K,也就是SQL语句中的最外层select count(*)操作;

第7行的”TABLE ACCESS BY USER ROWID”操作也是实际返回行196K(仔细看,Starts的值为196K,也就是执行196K次,这个好恐怖),第7行的操作就是子查询”select min(rowid) from ……”。

这样看来SQL语句的外层select有多少行,里面的子查询就执行多少次,而现在的外层select是196K行,然后呢,196K*196K = ?我都不敢想……

总体上看,加一个no_merge的Hint,先是让SQL的执行时间与原先相比降低了好多。

于是,我和开发同事进行沟通,我才明白SQL是应用服务器里跑的一个定时任务,每天凌晨4点开始执行,最后他给程序里的SQL增加no_merge的Hint。

问题解析(二)

第二天,我用视图v$active_session_history查看凌晨4点到6点的DBLINK等待事件。

从上面的查询,我们可以看出,有两条SQL的DBLINK等待事件总数多的离谱。其实另外一条SQL和我前面分析的那条唯一的区别就是在select最外层又加了一个ROWNUM <= ":2" 的条件,目前我们只分析原先的那条。

那么,再查询6点到7点的情况,已经没有DBLINK的等待事件,说明那些相关的SQL执行完毕,如下图所示。

另外,我们从AWR的对比报告中也可以看出上面的查询结果(AWR是从视图DBA_HIST_ACTIVE_SESS_HISTORY中读取相关信息)。

从上面的AWR图中我们还可以看出那两条SQL的执行次数分别为3106和3039。

从前面的执行计划分析,我们了解到SQL主要慢在内联视图r的返回行很多,那么继续优化就是要改写内联视图。

首先,将内联视图r的外层select查询中增加和内层select查询中同样的where条件,这样就能过滤掉许多行,同时将两层select查询中的school_id字段进行关联,如下图所示。

然而只需4毫秒就显示查询结果,带统计信息的执行计划如下图所示,

接下来,我和开发同事进行了沟通并把我改写后的SQL发给他,他测试运行和原先SQL相比,也认为在运行时间上差了一个数量级。后来,他根据业务的需求改写了原来的SQL,整个改写后的SQL语句如下图所示。

查看带统计信息的执行计划,如下图所示。

通过上面的执行计划,大家可以看出Starts、E-Rows、A-Rows的值都变得很小了,A-Time的值为1~2毫秒。

第三天,再次查看相应时间段的DBLINK等待事件总数,发现与原来相比已经降低了很多。

再查看SQL_ID为a50rh3659p44q的SQL在相应对间段的执行次数,见下图。

同样的,从下面折AWR报告中也能看出和上面的查询一样的效果。

总结

最后对使用DBLINK的SQL优化过程总结:

(1) 从EMCC监控上抓取有问题的SQL;

(2) 通过给SQL增加gather_plan_statistics的Hint通过实际运行测试;

(3) 生成相应的行源执行计划并分析哪一步操作最消耗时间;

(4) 找出对应的方法(并不一定是改写,这个根据具体情况而定),再次进行测试;

(5) 与开发人员沟通,并重新审核修改SQL代码。(若无需更改代码的优化,那就再好不过了)

原文发布时间为:2017-12-13

本文作者:赵全文

时间: 2024-10-29 04:03:50

经典案例:如何优化Oracle使用DBlink的SQL语句的相关文章

Oracle性能优化学习笔记之共享Sql语句

       为了不重复解析相同的SQL语句,在第一次解析之后,Oracle将SQL语句存放在内存中.这块位于系统全局区域SGA(systemglobal area)的共享池(shared buffer pool中的内存可以被所有的数据库用户共享.因此,当你执行一个SQL语句(有时被称为一个游标)时,如果它和之前执行过的语句完全相同,Oracle就能很快获得已经被解析的语句以及最好的执行方案.Oracle的这个功能大大地提高了SQL的执行性能并节省了内存的使用.        可惜的是ORACL

使用优化器性能视图获取SQL语句执行环境

    Oracle SQL语句的运行环境分为多个不同的层次,主要包括实例级别,会话级别,语句级别,其优先级依次递增.即语句级别的执行环境具有最高的优先权,会话级别次之,实例级别最低.反过来,实例级别的环境设置影响全局,而会话级别的则影响当前会话,语句级别的设置当然也就只影响当前语句.由此可知,运行环境中每一个环节的参数都对最终的数据库性能或所执行的SQL语句有直接的影响.因此在对数据库优化或调试SQL时,获得当前SQL语句运行环境显得尤为重要.为此,Oracle提供了三个重要的视图来获取不同级

Oracle里的交叉SQL语句写法

oracle|语句 实例说明 资料表结构(红色为主键)==>主表:TEST_PART_COST_TAB(料号资料表)PART_NO  VARCHAR2(20)   PART_NAME  VARCHAR2(50)  从表:TEST_PART_COST_DT_TAB(料号成本资料表)PART_NO VARCHAR2(10) COST_ID VARCHAR2(5) COST NUMBER  数据==>主表资料: PART_NO  PART_NAME1 1000            name1000

Oracle 数据库如何跟踪SQL语句

问题描述 我想把前台对Oracle数据库的每一条执行的sql语句跟踪出来,如何实现?谢谢大家指导! 问题补充:unika_ly12 写道 解决方案 首先,你要以dba身份登陆数据库.第二,为某个用户开启sql跟踪.那个用户就是你要跟踪的.正在执行sql语句的那个用户.命令如下:execute dbms_system.set_sql_trace_in_session(sid,serial#,true)其中参数的意义是,sid-会话id,serial#-序列号,这两个参数可以从v$session中得

ORACLE 创建DBlink访问SQL SERVER数据库

  Oracle中使用透明网关链接到Sqlserver 在最近项目中需要从Oracle中访问SQL Server数据库, 自然想到了透明网关. 因为Oracle数据库是Linux上的, 而Linux上的Oracle9i不包括连接到SQL Server的透明网关.就在一台单独的Windows服务器上安装了透明网关用做Oracle访问SQL Server的桥梁. 环境如下: Oracle Database Server:Linux + oracle 9.2.0.4 IP:10.194.129.197

oracle下一条SQL语句的优化过程(比较详细)_oracle

原来的语句是这样的: select sum(sl0000) from xstfxps2 where dhao00 in ( select dhao00 from xstfxps1 where trunc(ywrq00)=trunc(sysdate) and khdm00='500000003913'); 已用时间: 00: 02: 49.04 Execution Plan ---------------------------------------------------------- 0 S

ASP.NET访问Oracle数据库:执行SQL语句过程

Web服务器的配置: 1.安装Oracle 客户端 参考<Oracle 9i & PLSQL 全简体中文版数据库安装过程(图解)>,在选择安装的时候仅安装客户端即可 2.为安装客户端的服务器配置Net 服务 参考 <Oracle 9i/10g 数据库 创建数据库 Net 配置 创建表 SQL查询 创建存储过程> 3.新建一个用户,并赋予OBA角色 1.通过PL SQL 建立用户 使用SysDBA系统用户登陆 PLSQL ,建立一个用户 赋给此用户OBA角色.

Oracle的翻页Sql语句

StringBuffer pagingSelect = new StringBuffer(100); pagingSelect.append("select * from ( select row_.*, rownum rownum_ from ( "); pagingSelect.append(sql); pagingSelect.append(" ) row_ where rownum <= " + endRow + ") where rownu

Oracle中捕获问题SQL语句

SQL> select sid,event,p1,p1text from v$session_wait; 如果发现存在大量db file scattered read及db file sequential read等待. 显然全表扫描等操作成为系统最严重的性能影响因素. 使用下面的SQL语句可以得到指定SID的sql内容 SELECT sql_text FROM v$sqltext a WHERE a.hash_value = (SELECT sql_hash_value FROM v$sess