操作database TableMeta几点内容

背景

   今天早上,领导给了我一个任务:在老的系统运行中,DBA反馈说获取database TableMeta操作有点慢,让我分析下基于oracle driver驱动是否可以做下优化。由此引出了本文,仅仅做一个记录。

内容

在补充几点背景知识:

 

1.  老系统介绍

  • 老系统主要负责的业务是做跨机房之间的数据库记录同步,需要获取数据库的table meta信息,进行构造对应的sql。将源数据的columns变化,通过sql方式更新到目标库上。
  • table meta信息分析时,需要获取table的字段,主键,需要支持视图,同义词等表查询

2.  table meta操作原理

1.jdbcTemplate.execute(new ConnectionCallback() {
2.
3.            public Object doInConnection(Connection c) throws SQLException, DataAccessException {
4.                DatabaseMetaData meta = c.getMetaData();
5.                meta.getTables(catalog, schemaPattern, tableNamePattern, types);
6.                meta.getColumns(catalog, schemaPattern, tableNamePattern, columnNamePattern);
7.                meta.getPrimaryKeys(catalog, schema, table);
8.                return null;
9.            }
10.        });

简单一点说,就是利用java.sql.DatabaseMetaData接口中定义的meta信息获取接口进行处理。

 

mysql/oracle实现

oracle实现(oracle.jdbc.driver.OracleDatabaseMetaData):

1. getTables

主要是通过构造对应的SQL进行查询,主要是关联了all_objects 和 all_tab_comments, all_synonyms

1.SELECT NULL AS table_cat,
2.o.owner AS table_schem,
3.o.object_name AS table_name,
4.o.object_type AS table_type,
5.c.comments AS remarks
6.FROM all_objects o, all_tab_comments c
7.WHERE o.owner LIKE #schema# ESCAPE '/'
8.AND o.object_name LIKE #table# ESCAPE '/'
9.AND o.object_type IN ('TABLE', 'SYNONYM', 'VIEW')
10.AND o.owner = c.owner (+)
11.AND o.object_name = c.table_name (+)
12.UNION
13.SELECT NULL AS table_cat,
14.s.owner AS table_schem,
15.s.synonym_name AS table_name,
16.'SYNONYM' AS table_table_type,
17.c.comments AS remarks
18.FROM all_synonyms s, all_objects o, all_tab_comments c
19.WHERE s.owner LIKE #schema# ESCAPE '/'
20.AND s.synonym_name LIKE #table# ESCAPE '/'
21.AND s.table_owner = o.owner
22.AND s.table_name = o.object_name
23.AND o.object_type IN ('TABLE', 'VIEW')
24.AND o.owner = c.owner (+)
25.AND o.object_name = c.table_name (+)
26.ORDER BY table_type, table_schem, table_name

注意一下#schema# , #table#的替换,可以使用%进行模糊匹配

 

2. getColumns

主要是通过构造对应的SQL进行查询,主要关联了all_tab_comments, all_synonyms, all_col_comments.

1.SELECT NULL AS table_cat,
2.DECODE(s.table_owner, NULL, t.owner, s.table_owner) AS table_schem,
3.DECODE(s.synonym_name, NULL, t.table_name, s.synonym_name) AS table_name,
4.t.column_name AS column_name,
5.DECODE (t.data_type, 'CHAR', 1, 'VARCHAR2', 12, 'NUMBER', 3,
6.'LONG', -1, 'DATE', 93 , 'RAW', -3, 'LONG RAW', -4, 'BLOB', 2004, 'CLOB', 2005, 'BFILE', -13, 'FLOAT', 6, 'TIMESTAMP(6)',
7.93, 'TIMESTAMP(6) WITH TIME ZONE', -101, 'TIMESTAMP(6) WITH LOCAL TIME ZONE', -102, 'INTERVAL YEAR(2) TO MONTH', -103,
8.'INTERVAL DAY(2) TO SECOND(6)', -104, 'BINARY_FLOAT', 100, 'BINARY_DOUBLE', 101, 1111) AS data_type,
9.t.data_type AS type_name,
10.DECODE (t.data_precision, null, t.data_length, t.data_precision) AS column_size,
11.0 AS buffer_length,
12.t.data_scale AS decimal_digits,
13.10 AS num_prec_radix,
14.DECODE (t.nullable, 'N', 0, 1) AS nullable,
15.c.comments AS remarks,
16.t.data_default AS column_def,
17.0 AS sql_data_type,
18.0 AS sql_datetime_sub,
19.t.data_length AS char_octet_length,
20.t.column_id AS ordinal_position,
21.DECODE (t.nullable, 'N', 'NO', 'YES') AS is_nullable
22.FROM all_tab_columns t , all_col_comments c , all_synonyms s
23.WHERE (t.owner LIKE #schema# ESCAPE '/' OR
24.       (s.owner LIKE #schema# ESCAPE '/' AND t.owner = s.table_owner))
25.        AND (t.table_name LIKE #table# ESCAPE '/' OR
26.        s.synonym_name LIKE #table# ESCAPE '/')
27.        AND t.column_name LIKE #column# ESCAPE '/'
28.        AND t.owner = c.owner (+)  AND t.table_name = c.table_name (+)  AND t.column_name = c.column_name (+)
29.        AND s.table_name (+) = t.table_name  AND ((DECODE(s.owner, t.owner, 'OK','PUBLIC', 'OK',NULL, 'OK','NOT OK') = 'OK') OR (s.owner LIKE 'SRF' AND t.owner = s.table_owner))
30.        ORDER BY table_schem, table_name, ordinal_position

注意一下#schema# , #table# , #column#的替换,可以使用%进行模糊匹配

3. getPrimaryKeys

主要是通过构造对应的SQL进行查询,主要关联了 all_cons_columns, all_constraints

1.SELECT NULL AS table_cat,
2.c.owner AS table_schem,
3.c.table_name,
4.c.column_name,
5.c.position AS key_seq,
6.c.constraint_name AS pk_name
7.FROM all_cons_columns c, all_constraints k
8.WHERE k.constraint_type = 'P'
9.  AND k.table_name = #table#  AND k.owner like #schema# escape '/'
10.  AND k.constraint_name = c.constraint_name
11.  AND k.table_name = c.table_name
12.  AND k.owner = c.owner
13.  ORDER BY column_name

注意一下#schema# , #table# 的替换,可以使用%进行模糊匹配

mysql实现:

1.使用sql语法查询对应的INFORMATION_SCHEMA信息

1.SELECT TABLE_SCHEMA AS TABLE_CAT,
2.NULL AS TABLE_SCHEM, TABLE_NAME,
3.CASE WHEN TABLE_TYPE='BASE TABLE' THEN 'TABLE' WHEN TABLE_TYPE='TEMPORARY' THEN 'LOCAL_TEMPORARY' ELSE TABLE_TYPE END AS TABLE_TYPE,
4.TABLE_COMMENT AS REMARKS
5.FROM INFORMATION_SCHEMA.TABLES WHERE
6.TABLE_SCHEMA LIKE #schema# AND TABLE_NAME LIKE #table# AND TABLE_TYPE IN ('BASE TABLE','VIEW','TEMPORARY')
7.ORDER BY TABLE_TYPE, TABLE_SCHEMA, TABLE_NAME  

2.使用show命令查询对应的meta信息

1.SHOW TABLES from retl like 'columns';
2.show full columns from columns from retl like 'text%' ;  

具体的getTables,getColumns,getPrimaryKeys的实现就不一一贴了,有兴趣的可以自己去看看

优化方案

目前我们新老系统分别使用了ddlutilsschemacrawler两种tablemeta分析方案,最终都是基于DatabaseMetaData进行数据获取。

  • ddlutils:版本1.0(比较早的版本,目前最新为1.3)
  • schemacrawler:版本8.7

两者在实现上没有本质的区别,只不过在schemacrawler在meta信息的获取上可自定义性更强,比如你只关注table,不关注columns,primarykeys,foreignkey等,都可以通过SchemaCrawlerOptions进行指定

 

schemaCrawler例子:

1.Connection connection = dataSource.getConnection();
2.DatabaseMetaData databaseMetaData = connection.getMetaData();
3.String nameSpace = dataMedia.getNamespace();
4.String name = dataMedia.getName();
5.if (databaseMetaData.storesUpperCaseIdentifiers()) {// 识别大小写
6.    nameSpace = nameSpace.toUpperCase();
7.    name = name.toUpperCase();
8.}
9.if (databaseMetaData.storesLowerCaseIdentifiers()) {
10.    nameSpace = nameSpace.toLowerCase();
11.    name = name.toLowerCase();
12.}
13.
14.final SchemaCrawlerOptions options = new SchemaCrawlerOptions();
15.options.setSchemaInfoLevel(SchemaInfoLevel.standard());
16.options.setSchemaInclusionRule(new InclusionRule(nameSpace, InclusionRule.NONE));
17.options.setTableInclusionRule(new InclusionRule(nameSpace + "." + name, InclusionRule.NONE));
18.Database database = SchemaCrawlerUtility.getDatabase(connection, options);
19.
20.Schema[] schemas = database.getSchemas();
21.
22.for(Schema schema : schemas) {
23.    for (Table table: Schema.getTables()) {
24.        Column[] columns = table.getColumns();
25.    }
26.
27.
28.
29.
30.
31.}

分析本质,主要还是调用DatabaseMediaData进行操作

1. MetadataResultSet results = null;
2. results = new MetadataResultSet(getMetaData()
3..getTables(unquotedName(catalogName),
4.           unquotedName(schemaName),
5.           tableNamePattern,
6.           TableType.toStrings(tableTypes)));// 调用getTables方法
7.
8. while (results.next())
9. {
10.// "TABLE_CAT", "TABLE_SCHEM"
11.final String tableName = quotedName(results.getString("TABLE_NAME"));
12.final TableType tableType = results.getEnum("TABLE_TYPE",TableType.unknown);
13.final String remarks = results.getString("REMARKS");
14.
15.final MutableSchema schema = lookupSchema(catalogName, schemaName);
16......
17.
18.if (tableInclusionRule.include(table.getFullName()))
19.{
20.  table.setType(tableType);
21.  table.setRemarks(remarks);
22.
23.  schema.addTable(table);
24.}
25. }

通过代码分析,可以看到获取meta信息的方式,总共有3次SQL查询. 

  1. 先获取匹配的表 getTables
  2. 对应的所有字段 getColumns
  3. 获取字段的主键信息 getPrimaryKeys

因此总结一下优化方案:

  • 因为我们是精确的table匹配,所以第一次的匹配表查询SQL可以避免。如果需要优化需要copy schemacrawl的部分代码进行优化。(少一次SQL查询,不过会给代码带来一定的维护成本)
  • oracle driver中针对同义词表的查询,在整个查询过程中都会去关联all_synonyms表,影响查询性能。(不过后续otter4.0上线后,可以支持非同名表的查询,以后可以逐步废弃同义词表的使用,从而优化meta信息的查询)
  • oracle/mysql driver在查询所有字段上都支持批量查询多个表,即意味着我们可以一次性查询相同schema下的所有同步表的信息。 (调整有一定的成本,需要完全自己解析ResultSet的结果对象,支持将Result解析为多个 Table)

最后

本文可能对他人借鉴意义并不是非常大,只为自己做一下记录,项目第一个版本上线后再来做一下对应的优化方案。优化无止境,fighting!!!!!

时间: 2024-12-21 10:17:16

操作database TableMeta几点内容的相关文章

c#-求解:C# 操作在word,将richtextbox内容粘贴到word时剪贴板报错

问题描述 求解:C# 操作在word,将richtextbox内容粘贴到word时剪贴板报错 要将RichTextBox中的内容通过剪贴板粘贴到word中. 现在粘贴时报错,说剪贴板为空,但我执行Ctrl+V,可以将剪贴板中的数据粘贴出来.但就是执行paste()时过不去. 代码如下 string strDirectory = System.IO.Directory.GetCurrentDirectory().ToString(); string strTempFileName = strDir

保存恢复-c# Clipboard操作。如何保存剪贴板内容,在操作完成后恢复内容

问题描述 c# Clipboard操作.如何保存剪贴板内容,在操作完成后恢复内容 看过别人的方法,将各种数据分类读取到数据,占用剪贴板完成后再分类保存.但这种方法存在问题.因为C#的剪贴板读取和保存数据类型是有限的,如果对于一些用户自定义书记的剪贴板或者其他程序的自定义数据.操作后是不能如实恢复剪贴板的. 别人的例子程序. object xx = null; string ctype = ""; try { if (Clipboard.ContainsText()) { ctype =

C#对XML操作:编辑XML文件内容

xml 第三章:XML文件记录的编辑使用C#来编辑XML文件,最方便的方法当然还是使用DATASET我们继续使用上一篇中的XML文件,如下: <users> <xs:schema id="users" xmlns="" xmlns:xs="http://www.w3.org/2001/XMLSchema" xmlns:msdata="urn:schemas-microsoft-com:xml-msdata"&

基于BootStrap Metronic开发框架经验小结【九】实现Web页面内容的打印预览和保存操作_javascript技巧

本篇文章主要介绍如何实现Web页面内容的打印预览和保存操作的相关知识,一起学习吧! 1.Web页面打印的问题 在此之前,我一般使用比较好用的LODOP来执行打印的操作,这个在我之前有很多文章都有涉及,这个控件是一个ActiveX的控件,需要下载安装后就可以在页面是进行打印的排版设计,预览,打印等操作,还是很方便的一个控件,因此都很适合普通内容的打印,证件的套打等操作. 不过随着浏览器技术的更新,这个插件在Chrome或者FireFox上好像不受支持了,基本上摒弃了这种插件的处理方式了.例如如果我

基于Metronic的Bootstrap开发框架经验总结(9)--实现Web页面内容的打印预览和保存操作

在前面介绍了很多篇相关的<Bootstrap开发框架>的系列文章,这些内容基本上覆盖到了我这个Bootstrap框架的各个主要方面的内容,总体来说基本达到了一个稳定的状态,随着时间的推移可以会引入一些更好更新的内容进行完善,本篇继续这个系列,主要介绍如何实现Web页面内容的打印预览和保存操作. 1.Web页面打印的问题 在此之前,我一般使用比较好用的LODOP来执行打印的操作,这个在我之前有很多文章都有涉及,这个控件是一个ActiveX的控件,需要下载安装后就可以在页面是进行打印的排版设计,预

PostgreSQL DaaS设计注意 - schema与database的抉择

PostgreSQL DaaS设计注意 - schema与database的抉择 作者 digoal 日期 2016-10-12 标签 PostgreSQL , DaaS , 模板 , schema , database , apply delay , standby 背景 市面上有一些提供DaaS服务的厂商,例如heroKu,可能有上百万的数据库服务: 又比如提供PaaS平台的服务商,数据库也会有很多,同事这些数据库可能也是模板化的,这些厂商并不一定是为每个客户都新建一个数据库集群来满足数据库

设计好的互联网产品:根据内容整理信息架构

文章描述:互联网产品的设计方法-搭建架构. 根据内容整理信息架构 三个内容模块,模块之间的信息组成是多变的. 客户的需求会有很多,或者只有一个.当一个客户有多个潜在需求,其中有1个或几个需求下单时,客服人员根据需求的关联性,给客户下一张订单. 代练人员根据订单,按照实际代练工作的状况,转化为生产单. 一个订单中可能转化为多个不同的生产单,每个生产单对应不同的生产线. 多个订单中可能转化为一个生产单来完成. 依据现实的操作,系统起初按照内容模块的特性,信息架构的主要层级,第一个层级分支为三个节点:

百度算法改革依旧围绕内容

百度最近算法的改革可谓快而狠,将那些不合要求的网站统统打入死牢.不管算法如何改革,其始终逃脱不了内容,而且是优质内容.百度算法改革依旧围绕内容,应该是一项长期政策. 之前曾写过内容与高质量内容一文,那时百度还没进行大刀阔斧的算法改革,在今日看来有些内容似乎已经不合时宜了. 关于内容,SEO的老前辈们都认为是最难解决的问题,如何保持始终有新的内容恐怕是一个重要问题.搜索引擎作为为用户提供内容的服务者,不得不考虑如何进行筛选和展现,因此百度的算法改革重点就是内容展现,这也一直是它很难突破的地方.即便

搜索引擎是如何判断页面文章内容是否原创的

本人最近在操作一个非主流站,内容是采集的,开始收录还好,后来不久就被k了,几万数据的站百度收录只剩几十.当然,我也知道一直采集也不是办法,可是人力有限,不可能去一条条加,也不现实.所以想搜索一下搜索引擎是怎么判定原创与否的,但很可惜,这方面的内容实在不多.然后我去以搜索工程师的角度去想了想,不禁一身冷汗啊,因为判定原创与否实在太简单了.我就按我的思维顺序分析一下,供参考. 下面我以这个文章为例来讲解.标题:南昊北京科技有限公司是专业的光标阅读机生产商.内容:南昊科技研发的光标阅读机读卡快,质量优