一个开发需求的解决方案 & Oracle临时表介绍

一、开发需求
最近有一个开发需求,大致需要先使用主表,或主表和几张子表关联查询出ID(主键)及一些主表字段,然后再用这些ID查找最多10张表中对应的记录,主表记录数大约2000万,每张子表的记录数均为百万以上,最多可能会有5000万,主表一条数据可能对应子表多条数据。现在开发使用的逻辑是:
1.使用条件查询主表或主表和几张子表(不同场景)符合条件的主表记录ID值及其他一些主表字段项。
2.利用这些主表ID值,分别和几张子表使用IN子句,查询出子表中符合条件的记录项。有几张子表,就执行几次SQL语句。

这么做的弊端是:
由于(1)查出的ID值最多可能会有100个以上,因此子表使用IN子句的时候很有可能导致CBO选择全表扫描,虽然从理论上说,一条SQL未必适用索引扫描效率就一定高,CBO一定是基于现有的统计信息选择一条成本值最低的执行计划,但一张百万级甚至千万级的表,全表扫描的效率可想而知(这儿我们不较真,可能通过SSD、Exadata硬件层面的使用能提高全表扫描的效率,此处只讨论一般存储条件下可行的方案)。另外,就是场景需要几张子表,就会执行几次SQL,一个场景下可能需要执行很多次SQL语句。

综合需求,可能至少有以下几种改进方案:
1.使用一条SQL完成上述需求。
(1.1) 主表和所有子表采用join关联的方式。
两表两表做join,又由于主子表之间是一对多的关系,很可能造成结果集因为笛卡尔积变得很大,应用处理出现内存溢出的错误。
(1.2) 使用union all的方式关联子表,作为VIEW,然后和主表做关联,这是罗大师推荐的方式,例如:

SELECT A.ID, A.NAME
FROM
T_ZHUBIAO A,
(SELECT ID, NAME FROM T_ZIBIAO1 UNION ALL SELECT ID, NAME FROM T_ZIBIAO2) B
WHERE A.NAME = 'A' AND A.ID = B.ID;

和(1.1)的区别就是每一张子表的检索都是一次独立的索引唯一扫描,所有子表关联后作为VIEW,和主表做一次嵌套循环连接。但据了解,需求中每张子表的字段基本都不相同,有的子表选择字段有几十个,这么一来,使用这种UNION ALL需要检索字段类型相同,开发拼接起来就比较费劲,不灵活。
2.将(1)的结果集存入一张临时表(temporary table,不是应用自行处理的普通表),相当于临时结果集,每次子表都是和这张临时表做两表关联查询,这么做可以避免因为IN值太多导致的低效检索,同时由于两表关联字段均为主键或外键(设置索引),可以使用索引扫描检索,采用交易级别控制的临时表,可以在完成本次交易后让Oracle自动清空数据,同时session之间数据隔离。
3.(1)不变,只是(2)中每次子表查询,由应用控制,例如每30个IN值执行一条SQL语句,将一次子表查询拆分为若干次查询,好处是每次可以使用外键索引扫描检索结果集,坏处就是无形中又多了N次SQL语句的执行。

综上三种方案,(1)由于潜在的结果集过大的问题以及灵活性问题,被开发否了,目前采用的是方案(3),因为其对开发的改造较小,仅需要拆分IN语句,如果检索效率较高,测试结论符合非功能要求,就采用这种方式,若不满足要求,则会考虑使用方案(2)。

就我来说,如果能满足需求,方案1是最好的,使用合适的索引完成一次检索,减少了应用和数据库之间的交互次数,但可能这种业务需求确实很复杂,获取信息方面确实要求比较高。其次是方案2,虽然子表执行SQL次数未变,但通过临时表,可以保证每次检索均可以使用索引快速定位,避免大表的全表扫描,同时临时表特性对应用几乎透明。方案3,唯一的好处就是避免了大表的全表扫描,但代价是会多一些SQL交互,至于究竟是否可以弥补性能上的差异,只能待性能测试的结论来看了。

如果各位对上述需求有更好的解决方案,或是上述方案仍有问题,还请不吝指正

二、临时表介绍和实验
需要缓存中间结果集的场景,可以考虑使用临时表,因为临时表中的数据是session级别私有,每个session仅能看见和修改自己的数据,在session结束的时候,表中数据会被自动删除,无需应用操作。创建临时表使用的是CREATE GLOBAL TEMPORARY TABLE语法,ON COMMIT子句则决定了表数据是交易级别还是session级别,默认是交易级别。可以对临时表创建索引、视图或触发器。

ON COMMIT子句的两种参数区别如下:

临时表中的数据默认存储于默认的临时表空间,可以创建过程中指定其他的临时表空间。临时表的数据和索引在定义的时候不会分配段,只有使用INSERT(CTAS)插入语句的时候,才会开始分配段空间。

创建交易级别临时表:

SQL> create global temporary table test (id number, name varchar2(10)) on commit delete rows;

查看表属性,TEMPORARY指定为Y,说明是临时表,没有tablespace_name参数值,说明不是使用普通表空间存储。

SQL> select table_name, tablespace_name, temporary from dba_tables where owner='BISAL';
TABLE_NAME       TABLESPACE_NAME      TEM
---------------- -------------------- ---
TEST                                  Y

session 1执行:

SQL> insert into test values(1, 'a');
SQL> select * from test;
ID NAME
-- ----
1  a

session 2执行:

SQL> select * from test;
no rows selected

说明临时表数据session级别隔离,

session 1执行:

SQL> commit;
SQL> select * from test;
no rows selected

执行commit结束交易,Oracle会自动删除临时表中数据。

创建session级临时表:

SQL> create global temporary table test (id number, name varchar2(10)) on commit preserve rows;

表属性相同:

SQL> select table_name, tablespace_name, temporary from dba_tables where owner='BISAL';
TABLE_NAME       TABLESPACE_NAME      TEM
---------------- -------------------- ---
TEST                                  Y

session 1执行:

SQL> insert into test values(1, 'a');
SQL> select * from test;
ID NAME
-- ----
1  a

session 2执行:

SQL> select * from test;
no rows selected

session 1执行:

SQL> commit;
SQL> select * from test;
ID NAME
-- ----
1  a

执行commit后,数据未删除。退出当前session再登陆,发现数据已被删除了:

SQL> select * from test;
no rows selected

总结:
临时表使用起来其实很简单,除了一些语法上和普通建表语句有些不同,对应用来说就可以当作普通表使用,但其实还是有一些细节需要注意:
1.临时表默认使用的是默认临时表空间,如果应用会有很多排序等需要耗费临时表空间的场景,而且临时表使用频率很高,那么为了避免互相影响,可以考虑为临时表建一个独立的临时表空间。
2.如果使用session级别的临时表,且应用使用了连接池,则需要确保应用完成一次交易过程中使用的是同一session,避免违反临时表使用规则。

时间: 2024-09-15 19:35:55

一个开发需求的解决方案 & Oracle临时表介绍的相关文章

winform-求解决方案:oracle in 内部有几千条记录,如何提高查询效率

问题描述 求解决方案:oracle in 内部有几千条记录,如何提高查询效率 有一个winform程序 一个只有一列的datagridview,是几千条(也有可能是几万条)身份证号记录(此数据是从excel导入的) 数据库中有10多万条客户信息(如姓名.身份证.联系方式等) 然后我想实现的功能是,根据datagridview内的身份证数据,从数据中查出该身份证对应的相关信息,并在另一个datagridview中展现出来. 我现在使用的方法是 select * where sfzh in (),的

sql-我要写一个java程序,去链接oracle数据库,如果获取链接的时间超过1分钟,就抛出异常,请问怎么实现?

问题描述 我要写一个java程序,去链接oracle数据库,如果获取链接的时间超过1分钟,就抛出异常,请问怎么实现? 我要写一个java程序,去链接oracle数据库,如果获取链接的时间超过1分钟,就抛出异常,请问怎么实现? 解决方案 http://blog.chinaunix.net/uid-20752328-id-3451931.html 这里有一篇文章可以解决你的问题你可以点击进去看看; 如果回答对您有帮助请采纳 解决方案二: 说明数据整理不合理吧 解决方案三: 你应该优化数据库结构,或你

ORACLE 临时表空间TEMP 满了怎么办?

oracle|临时表         最近遇到这样一个问题:前一段时间网页查询ORACLE表正常,可最近一直页面无法显示.打印出SQL放到PL/SQL Devoloper 执行,报"无法通过8(在表空间XXX中)扩展 temp 段",还有一个页面,可以查询出记录,但无法统计数据!       经过分析产生原因可能是:ORACLE临时段表空间不足,因为ORACLE总是尽量分配连续空间,一但没有足够的可分配空间或者分配不连续就会出现上述的现象.  解决方法:知道由于ORACLE将表空间作为

Oracle 临时表空间使用注意

oracle|临时表 临时表空间使用注意:1.临时表空间 是用于在进行排序操作(如大型查询,创建索引和联合查询期间存储临时数据)每个用户都有一个临时表空间2.对于大型操作频繁,(大型查询,大型分类查询,大型统计分析等),应指定单独的临时表空间,以方便管理 3.分配用户单独临时表空间,一般是针对 大型产品数据库,OLTP数据库,数据库仓库对于小型产品不需要单独制定临时表空间,使用默认临时表空间

Oracle临时表 优化查询速度

oracle|临时表|速度|优化 1.前言    目前所有使用Oracle作为数据库支撑平台的应用,大部分数据量比较庞大的系统,即表的数据量一般情况下都是在百万级以上的数据量.当然在Oracle中创建分区是一种不错的选择,但是当你发现你的应用有多张表关联的时候,并且这些表大部分都是比较庞大,而你关联的时候发现其中的某一张或者某几张表关联之后得到的结果集非常小并且查询得到这个结果集的速度非常快,那么这个时候我考虑在Oracle中创建"临时表".    我对临时表的理解:在Oracle中创

Oracle临时表 使用补充

oracle|临时表 1.当指定临时表为on commit preserve rows得时候(会话级),在当前SESSION中像要将该表进行drop得时候,oracle提示:drop table student            * ERROR at line 1: ORA-14452: attempt to create, alter or drop an index on temporary table already in use   如果你要删除这样表,方法有两个:一是退出这个SES

Oracle临时表的用法及意义详解

Oracle临时表可以说是提高数据库处理性能的好方法,在没有必要存储时,只存储在Oracle临时表空间中.希望本文能对大家有所帮助. 1 .前言 目前所有使用 Oracle 作为数据库支撑平台的应用,大部分数据量比较庞大的系统,即表的数据量一般情况下都是在百万级以上的数据量. 当然在 Oracle 中创建分区是一种不错的选择,但是当你发现你的应用有多张表关联的时候,并且这些表大部分都是比较庞大,而你关联的时候发现其中的某一张或者某几张表关联之后得到的结果集非常小并且查询得到这个结果集的速度非常快

UI开发的终极解决方案

呵呵,有点标题党的意思,但是如果你正在寻找UI解决方案,你一定不会白来的. 虽然没有直接开发前台界面,但是好呆也看了这么些年,碰到许多关于UI的问题: UI中JS的引入与顺序,JS合并的问题 UI中css的引入与顺序,CSS合并的问题 UI中碰到性能问题时的影响范围,比如:一个树出现问题,要改动许多用到树的地方 代码重复的问题,同样的内容在许多地方都有,如果要改动就要改动许多个地方 整体布局调整困难的问题 开发效率的问题 执行效率的问题,前台响应要求速度更快 集群的问题 国际化的问题 ... 这

ORACLE临时表总结

临时表概念    临时表就是用来暂时保存临时数据(亦或叫中间数据)的一个数据库对象,它和普通表有些类似,然而又有很大区别.它只能存储在临时表空间,而非用户的表空间.ORACLE临时表是会话或事务级别的,只对当前会话或事务可见.每个会话只能查看和修改自己的数据.   临时表语法       临时表分类   ORACLE临时表有两种类型:会话级的临时表和事务级的临时表. 1)ON COMMIT DELETE ROWS 它是临时表的默认参数,表示临时表中的数据仅在事物过程(Transaction)中有