SQL优化器原理-Metadata

这是MaxCompute有关SQL优化器原理的系列文章之一。我们会陆续推出SQL优化器有关优化规则和框架的其他文章。添加钉钉群“关系代数优化技术”（群号11719083）可以获取最新文章发布动态(二维码在文章末尾)。

简介

SQL是一种关系代数，在进行关系代数等价转换时，我们利用Metadata获得更多的上下文和数据信息，而从获得更优的执行计划。为了进一步介绍Metadata如何让优化器更加“Smart”，接下来会先介绍几种使用Metadata的场景。

场景

SELECT trade_date, count(trade_id) cnt_of_trades FROM trades GROUP BY trade_date;

这个语句是想要以交易日为单元，计算交易日内的交易笔数。而语句的执行效率（时间）依赖于数据的分布情况。
假设收到的trades数据集合如图1：

为了计算这个聚合操作，在分布式数据处理系统中，会把trades数据分成多份。假设分成3份，由3个Worker进行初步处理。处理的流程如下：
a. 本地聚合，将本地看到的数据进行trade_date聚合计算
b. 本地排序，将同个分布桶内的数据根据trade_date进行排序
c. 重分布排序，是Reduce之前的处理。它将多个前置Worker产生的多个分布桶数据进行归并排序
d. 归约聚合，再将最终的数据进行全局的聚合

如上是一般情况下Trades数据时的操作流程。本地聚合起到了减少数据量的功能，对于Worker_0输入有3条记录，但向后输出只需要2条记录。本地排序和重分布排序是将数据排序，使得归约聚合操作每次只针对一个group进行。
接下来，咱们看一些特殊的数据，如下图2：

图2中可以看到每个trade_date只有一笔交易。从刚才通用的处理流程中可以看到：
a. 本地聚合没起到任何数据减少作用，因为每个Worker收到的交易列表里没有重复trade_date
b. 两个排序操作进行数据归并处理也是无用功，因为每笔交易都是属于一个group
对于此种场景，我们就可以把“本地聚合”、“本地排序”和“重分布排序”阶段去掉，直接跳至归约聚合即可以。
这些数据特征可以通过何种方式发现呢？这就是本篇想要引出的主题——Metadata（元数据）

Metadata

什么是Metadata？概括地说，它是数据特征的描述。SQL描述了数据的处理逻辑，从原始数据作为初始数据集合，经过关系代数的基本运算而得到最终的结果数据集合。而Metadata信息的最初始来源是原始数据自身的特征，同时包含了中间过程的数据推导计算。
借由前面的例子，将SQL转换成关系代数的运算符描述，如图：

TableScanOp0_trades表示从表trades上读取原始数据
AggOp1表示将原始数据根据trade_date进行聚合操作
SelectOp2表示将聚合的结果展现出来
AdhocSinkOp3表示在标准输出中显示结果

前面场景所描述的“本地聚合”、“本地排序”、“重分布排序”和“归约聚合”就是AggOp1的物理执行操作描述。

优化器拿到此逻辑操作DAG图后就开始着手将它转换成物理操作DAG图（TableScanOp0_trades、SelectOp2和AdhocSinkOp3在此处不着重讲述）。优化器会生成代数等价的两种选择，如下图所示：
两种执行计划如何选择，优化器依靠的是cost（代价）计算。plan的输入数据量是一致的（假设为rc0）。

对于plan a，它对输入数据没有任何处理，所以网络分发和排序的数据量为rc0，而后对rc0的数据进行reduce端的聚合操作。

对于plan b，它对输入数据进行了本地聚合（HashAgg），若本地存在重复Key的数据，则网络分发和排序的数据量则会压缩成rc1（假设压缩后的数据量）。

当HashAgg计算结果的“压缩”率越高（即rc1越小），则网络分发和排序的数据量就越小。如Trade1和Trade2两种数据特征。Trade1情况下，利用HashAggOp就可以减少网络分发和排序的数据量。而Trade2因为数据不存在重复性（交易单中每天只有一单交易），所以Plan b的HashAggOp没有减少数据量，如此StreamLineWriteOp的输入数据跟Plan a的StreamLineWriteOp是一样的。从整体上看，Plan b增加了HashAggOp的计算的浪费，所以Plan a的代价比较小，如此在Trade 2情况下就会选择Plan a。
从上面的分析可以看出，关键点在于HashAggOp操作产生的数据特征。HashAggOp是进行本地聚合，当输出减少的数据量所获得的利润空间大于HashAggOp自身的计算代价时，Plan b就会被推举。而如何判断输出数据量呢？优化器利用的是一种Metadata：Number of Distinct Value (NDV)。对于Trade例子，HashAggOp操作想要知道它的输出数据量，就需要知道它的输入操作符中对于相关列的NDV值，即Output(HashAggOp) = NDV(inputOp)。NDV的计算依赖于三个信息：操作符类型、引用列和当前的过滤条件。inputOp可能是各种各样的操作符，而不同的操作符，计算的NDV的算法有所不同：

Aggregate：根据列的来源（当前操作符生成或是输入操作符传递），将引用列和过滤条件进行分离。根据输入操作符，以及相关的引用列和过滤条件获得输入操作符的NDV，再根据当前过滤条件的选择率，两者相乘得到当前操作符的NDV。
NDV(Aggregate, groupKey, predicates) = NDV(inputOp, pushableGroupKey, pushablePredicates) * Selectivity(notPushablePredicates)
Filter：将filter自身的过滤条件与后置操作符传递而来的过滤条件合并后作为输入操作符的过滤条件，计算的结果作为当前操作符的NDV。
NDV(Filter, groupKey, predicates) = NDV(inputOp, groupKey, union(predicates, conditions)
Project：根据列的来源（当前操作符生成或是输入操作符传递），将引用列和过滤条件进行分离。根据输入操作符，以及相关的引用列和过滤条件获得输入操作符的NDV，再根据当前过滤条件生成选择率和当前操作符引用列的cardinality进行修正NDV。
NDV(Project, groupKey, predicates) = NDV(inputOp, pushableGroupKey, pushablePredicates) * Selectivity(notPushablePredicates) * Cardinality(notPushableGroupKey)
Join：根据列的来源将引用列和过滤条件进行分离。计算各个输入操作符的NDV。再根据Join操作符的可能最大NDV个数与Join操作符行个数计算出实际连接而产生的NDV值。最后再通过当前的过滤条件进行修正。
NDV(Join, groupKey, predicates) = guessNDV(MAX(NDV(inputOp, pushableGroupKey, pushablePredicates)), ROW(Join)) * Selectivity(notPushablePredicates)
（ps：计算Join操作符的可能最大NDV个数，可以有多种策略：一种是取inputOp的最大NDV值；另一种是最inputOp的NDV值相乘积。第二种是理论最大值，但它往往与实际的数据情况相差较大，所以一般使用第一种策略。）
TableScan：根据引用列查找系统收集的数据NDV，并通过过滤条件进行修正。

目前优化器针对于原始数据NDV计算有两种方式：一种是Analyze语句手动触发；另一种是在数据生成时并行收集。这两种方法收集的统计项除了NDV外还有其它一些常用的信息，包含：
a. avgColLen：平均行的长度
b. maxColLen：最大行的长度
c. minValue：最小值
d. maxValue：最大值
e. estimateCountDistinct：即NDV，不同值个数
f. numNulls：null个数
g. numFalses：false个数（boolean有效）
h. numTrues：true个数（boolean有效）
i. topK：前k个值的占比
这些统计信息被用来Metadata的原始数据，最终体现在Metadata的演算中。

结语

Metadata是优化器的核心模块，它为优化系统提供更多的数据信息以获得更优的执行计划。除了MdDistinctRowCount（NDV）外，我们还提供了MdPredicates（获得前置谓词）、MdRowCount（获得数据行数）、MdSize（获得数据列长度）等等。后续会进一步详细地介绍其它的Metadata使用。

时间： 2024-10-31 09:01:23

SQL优化器原理-Metadata的相关文章

SQL优化器原理 - Join重排

这是ODPS有关SQL优化器原理的系列文章之一.我们会陆续推出SQL优化器有关优化规则和框架的其他文章.添加钉钉群"关系代数优化技术"(群号11719083)可以获取最新文章发布动态. 本文的目标是解释Join重排这个特性的基础概念和算法,如果想快速了解并在MaxCompute上使用这个特性,请直接跳到"总结". 简介 Join重排是经典的SQL优化问题.考虑3个表的自然连接 A ⋈ B ⋈ C ,在不影响最终结果集的前提下,可以改变连接的顺序为下列: A ⋈ C

SQL优化器原理－Shuffle优化

这是MaxCompute有关SQL优化器原理的系列文章之一.我们会陆续推出SQL优化器有关优化规则和框架的其他文章.添加钉钉群"关系代数优化技术"(群号11719083)可以获取最新文章发布动态. 本文主要介绍MaxCompute Optimizer对Shuffle方面的相关优化. 1 简介分布式系统中,Shuffle是重操作之一,直接影响到了SQL运行时的效率.Join.Aggregate等操作符都需要借助Shuffle操作符,确保相同数据分发到同一机器或Instance中,才可以

SQL优化器原理 - Auto Hash Join

这是MaxCompute有关SQL优化器原理的系列文章之一.我们会陆续推出SQL优化器有关优化规则和框架的其他文章.添加钉钉群"关系代数优化技术"(群号11719083)可以获取最新文章发布动态(二维码在文章末尾). 本文主要描述MaxCompute优化器实现的Auto Hash Join的功能. 简介在MaxCompute中,Join操作符的实现算法之一名为"Hash Join",其实现原理是,把小表的数据全部读入内存中,并拷贝多份分发到大表数据所在机器,在 m

sql优化器探讨

优化多年以来,商业数据库生产商一直致力于提高数据库的查询性能.尽管他们持续地付出努力和辛勤地工作,我们还是无法看到关系型数据库系统(rdbms)在性能上有显著的提高.用户继续忍受性能低下的sql语句,数据库专家们继续在sql语句优化的泥潭中痛苦挣扎. 本文将介绍数据库查询优化器是如何工作的.为什么问题持续存在,并深入探讨数据库查询优化器将来的发展方向. 数据库查询优化器数据库查询优化器是rdbms服务器的一个组成部分.对于基于成本的优化,数据库查询优化器的任务是,通过产生可供选择的执行计划,

数据库优化器原理 - 如何治疗选择综合症

标签 PostgreSQL , 单列索引 , 复合索引 , 优化器 , 成本因子背景 RBO -> CBO -> 动态优化经常听到这样的声音:"查询慢?加个索引吧.",虽然话不专业,但是体现了早期基于RBO(基于规则)的优化器思维. 通常对业务不熟悉,或者对数据库不熟悉时,可能会凭自觉做出这样的判断. RBO思维存在较大的问题,所以导致了CBO(基于成本)的出现. 再往后,(生成执行计划->执行这样的)静态CBO又要落伍了,紧接着会是动态的执行计划(边执行->

【SQL优化器】初始化参数

一些和优化器相关的初始化参数 1.OPTIMIZER_FEATURES_ENABLE 每个版本的Oracle 优化器特性都不相同,特别是做了版本升级以后一定要修改这个参数才可以使用仅被该版本支持的优化器特性. 可以赋予它的值如:9.2.0.9.0.2.9.0.1.8.1.7.8.1.6 等. 2.CURSOR_SHARING 这个参数会将SQL 语句中的常量用变量来替换,存在大量常量的OLTP 系统可以考虑启用这个参数.但是有一点要明白,绑定变量虽然可以使大量的SQL 重用,减

【SQL优化器查询变换器】视图合并(View Merging)

(基于成本的优化器组件) 查询变换器被解析器解析过的查询语句进入查询变换器,表现出来的是一组查询块(query block), 这些查询块之间是相互关联的或者是嵌套的,查询的形式决定这些查询块相互之间如何被关联.查询变换器的主要目的就是决定改变查询的形式是否有利于产生一个好的执行计划.查询变换器使用四种不同的查询变换技术: 1- 视图合并(View Merging) 2- 谓词推进(Predicate Pushing) 3- 非嵌套子查询(Subquery Unnesting) 4-

优化器里的概率学 - 性能抖动原理分析

标签 PostgreSQL , 概率学 , 优化器 , 索引 , filter , 数据分布 , 数据倾斜背景数据库的优化器大量的使用了概率学的知识,例如高频词的频率,数据分布柱状图,评估某个VALUE有多少行,评估物理存储与列的线性相关性等等. PostgreSQL 里面的统计学知识: <用PostgreSQL了解一些统计学术语以及计算方法和表示方法 - 1> <PostgreSQL数据库监控中的统计学 - 对象SIZE的数据分布图> <PostgreSQL 统计信息之

PgSQL · 源码分析 · PG优化器浅析

在使用PostgreSQL数据库过程中,对SQL调优最常用的手段是使用explain查看执行计划,很多时候我们只关注了执行计划的结果而未深入了解执行计划是如何生成的.优化器作为数据库核心功能之一,也是数据库的"大脑",理解优化器将有助于我们更好地优化SQL,下面将会为大家解开PostgreSQL优化器神秘的面纱. SQL执行过程在PG数据库中,对于DDL语句无需进行优化,到utility模块处理,对于DML语句需要到优化器中处理,一个用户连接从接收SQL到执行的流程如下: 查询重写

猜你喜欢

H3C S系列三层交换机负载分担、链路备份的实现过程

实验背景: 随着公司规模的不断扩大,网络部门同时申请了两根光纤,其中一根为10M,另外一根为20M,由于带宽不对称,要求在三层交换机上做策略路由实现2:1的流量分配,其次要求两条线路互相备份,从而实现 ...

控制PPT课件中Flash歌曲的播放

控制在PowerPoint课件中,插入Flash动画已经不是什么新鲜事了. 这不,这次的英语课件中,应英语老师的要求,插入了网上找来的一个Flash英文歌,果然为课件增色不少.但英语老师提出要在 ...

gprs网络优化：3g知识

GPRS网络优化比GSM网络优化更复杂.GPRS系统以GSM网为承载网,使用现有的GSM无线网络,GPRS和GSM共用相同的基站和频谱资源,这就决定了GPRS网络与GSM网络优化存在相互关联又相互制约 ...

wcdma和cdma2000的比较

WCDMA和cdma2000都满足IMT-2000提出的全部技术要求,包括支持高比特率多媒体业务.分组数据和IP接入等.这两种系统的无线传输技术均基于DS-CDMA作为多用户接入技术,单就技术来说,W ...

WCF技术剖析之三十：一个很有用的WCF调用编程技巧[上篇]

在进行基于会话信道的WCF服务调用中,由于受到并发信道数量的限制,我们需要及时的关闭信道:当遇到某些异常,我们需要强行中止(Abort)信道,相关的原理,可以参考我的文章<服务代理不能得到及时关 ...

解析Windows XP系统的管理

现在很多个人用户都使用了Windows XP系统,但你知道吗?在Windows操作系统中自带了一系列的工具,这些工具中很多都是用来对系统进行维护的,本文中笔者将向大家介绍这些工具如何使用.同时笔者将从 ...

Pear::Pager分页类简介

Pear的Pager分页类是一个很好用的php分页类,扩展性很强,能够适应各种分页情况的需求,至少我在几年间大大小小的项目里,基本上没有为分页额外写过代码,全部都是用的Pager,足见Pager的可用 ...

Oracle管理安全和资源（三）Oracle资源管理器简介

Oracle资源管理器(Oracle Database Resource Manager,以下简称DBRM)管理数据库资源,为不同的会话分配不同的数据库资源.DBRM管理的资源主要包括CPU时间.下面 ...

调出竹林婚片粉嫩的黄青色

调出竹林婚片粉嫩的黄青色素材图片拍摄的非常大气,构图也比较完美.不过背景部分颜色过于单调,不能很好的突出人物部分.处理的时候可以适当调亮背景,把各层次的颜色适当美化即可. 原图 <点小图查 ...

Win8系统运行速度正常但开机很慢怎么办？

Win8系统运行速度正常但开机很慢怎么办? Win8速度变慢原因 1.驱动不兼容:使用驱动精灵更新驱动. 2.系统垃圾太多:使用金山卫士清理垃圾优化系统. 3.硬件老化:用橡皮擦内存条.清理机箱内 ...

如何删除WinXP系统自带的流氓文件夹

如何删除WinXP系统自带的流氓文件夹这些文件夹是怎么来的呢? 其实,虽说这些文件夹都有着不请自来的坏毛病,但并不是每一个文件夹都一无是处,比如"我接收到的文件"就是专门供微 ...

win7 64位如何安装打印机

1.打开控制面-点击设备和打印机 2.点击添加打印机 3.选择添加本地打印机 4.这里选择打印机端口,之后进入下一步 5.选择打印机,可以按照提示选择自己需要的 6.输入打印机名称,可以输入自己喜 ...

Mac如何设置丢失模式？

很多人都知道,iPhone有"查找我的iPhone(Find My iPhone)"功能,一旦丢失,可以通过该功能对手机进行定位并锁定,运气好的话可以找回.其实这一功能并不是i ...

如何自动释放系统资源

系统在运行程序的时候,资源被占用就会减少.但资源是有限的,如果程序在消耗大量资源后,关闭程序也还有DLL文件在运行,这就会造成系统运行速度下降. 解决这种情况,可以对修改注册表键值进行修改,让程序 ...

Notadd Beta2 fix1，基于 Laravel 的下一代 PHP 开发框架

Notadd Beta2 fix1 发布了,更新如下: Beta 2 fix1 (170527) 增强安装的逻辑处理移除后台登录二次请求链接的问题增强了权限架构(四级) 修复后台偶尔不能登录的问题 ...

memcache和redis对比

1.redis可以持久化,memcache不具备此功能,重启后数据丢失 2.memcache和redis在性能相比,memcached性能要高一些,并且支持多核,redis只搞单核,不过总的来说,在性 ...

运维的85条军规

1) 承载能力优先--随后再进行优化--不遵守这条规则必定带来故障停机时间.不要在故障停机时间的压力下进行优化--要先集中精力提高承载能力. 2) 以Postgres为例,一定要确保你的每一个网络都能 ...

数据库数据备份-让数据库能保存最近15天的数据，并且15天以前的数据都需要备份。

问题描述让数据库能保存最近15天的数据,并且15天以前的数据都需要备份. 如题,让数据库能保存最近15天的数据,并且15天以前的数据都需要备份,有什么高效的解决办法?我的程序是每天24小时都在运行的 ...

sysbench安装

sysbench是一个模块化的.跨平台.多线程基准测试工具,主要用于评估测试各种不同系统参数下的数据库负载情况.关于这个项目的详细介绍请看:http://sysbench.sourceforge.ne ...

哪里有搜索框，哪里就是他们的天下

摘要: 借用今天下午刚看到的一则移动互联网产品的数据报告,来说一下未来的SEOer工作者应该做哪些转变,因为本人从事的是SEO工作,所以不得不为自己的饭碗做一些未来的打算.呵呵接下借用今天下午刚看 ...

广东浙江成为苹果钓鱼网站分布的重灾区

苹果产品的热销滋生了一条黑色产业链,围绕苹果做文章的钓鱼网站通过各种骗术欺诈网民的案例越来越多.金山毒霸发布的周钓鱼网站数据显示,广东浙江已经成为苹果钓鱼网站分布的重灾区. 诱惑的低价毒苹果苹果钓鱼 ...

C/S的系统如何实现1000个客户端对服务器的访问

问题描述 1C/S的系统如何实现1000个客户端对服务器的访问2当客户端发送信息的过程中断网了服务器端怎么办或者当服务器端返回信息给客户端断网了怎么办如何处理这些异常解决方案解决方案二:该回复于2 ...

ontouchlistener()-为什么我执行此方法是五响应

问题描述为什么我执行此方法是五响应 rlbttom.setOnTouchListener(new OnTouchListener() { public boolean onTouch(View v, ...

java反编译工具

问题描述大家谁有好的反编译工具,推荐下,最近用那个jd-gui-0.3.3.windows,这个版本的工具出来之后总是一堆注释,很烦人,就这样的/* */ package baby.com.cont ...

显微镜下的人体，超级震撼

我们总是认为我们的眼睛能够看到这个世界中的任何物质.任何物体,所以有些人产生了一种固执的观念,他认为通过眼睛看到的东西才是实实在在的:他看不见的就不相信.看不见就不相信,这话听起来很在理,可是在稍 ...

ASP.NET中Application、Cookie、Session、Cache和ViewState_基础应用

我们在做ASP.NET开发的时候经常会用到回话,我们在回话中存储一些数据,下面让我们来一一介绍一下Application.Cookie.Session.Cache和ViewState,以便我们选择在什 ...

Python中的闭包介绍及实例

Python中的闭包介绍闭包(Closure)是词法闭包(Lexical Closure)的简称,是引用了自由变量的函数.这个被引用的自由变量将和这个函数一同存在,即使已经离开了创造它的环境也不例外 ...

支持CGI+PHP ASP、ASP.net/FTP/WEB的免费空间

支持FTP/WEB方式上传与管理文件. 支持CGI, PHP, SSI, FrontPage Extensions, Perl等,并且免费提供MySQL数据库(可通过phpMyAdmin来管理). 美 ...

企业在微博做活动一定要懂的7个技巧

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅基本每个企业都会在微博做活动,活动 ...

面向企业虚拟私有云的虚拟专用网技术研究(博士论文)

博士论文面向企业虚拟私有云的虚拟专用网技术研究东华大学丁靖宇本文研究如何将虚拟专用网(VPN)技术整合到现有云计算构架中,从而实现云计算资源与企业IT资源的无缝融合,建立企业虚拟私有云(VP ...

热搜