你真的会玩SQL吗？透视转换的艺术

你真的会玩SQL吗？系列目录

透视转换是一种行列互转的技术，在转过程中可能执行聚合操作，应用非常广泛。

本章与你真的会玩SQL吗？数据聚合内容比较重要，还涉及到你真的会玩SQL吗？Case的用法的内容，都可以一起看。

下面的例子将使用OpenSchema表，运行创建表：

CREATE TABLE OpenSchema(
objectid INT NOT NULL,
attribute VARCHAR(30) NOT NULL ,
VALUE SQL_VARIANT NOT NULL,
PRIMARY KEY (objectid,attribute)
)
GO 

INSERT INTO OpenSchema(objectid,attribute,VALUE)
VALUES
(1,N'attr1',CAST(CAST('ABC' AS VARCHAR(10)) AS SQL_VARIANT)),
(1,N'attr2',CAST(CAST(10 AS INT) AS SQL_VARIANT)),
(1,N'attr3',CAST(CAST('20070101' AS SMALLDATETIME) AS SQL_VARIANT)),
(2,N'attr2',CAST(CAST(12 AS INT) AS SQL_VARIANT)),
(2,N'attr3',CAST(CAST('20090101' AS SMALLDATETIME) AS SQL_VARIANT)),
(2,N'attr4',CAST(CAST('Y' AS CHAR(1)) AS SQL_VARIANT)),
(2,N'attr5',CAST(CAST(13.7 AS NUMERIC(9,3)) AS SQL_VARIANT)),
(3,N'attr1',CAST(CAST('xyz' AS VARCHAR(10)) AS SQL_VARIANT)),
(3,N'attr2',CAST(CAST(20 AS INT) AS SQL_VARIANT)),
(3,N'attr3',CAST(CAST('20080101' AS SMALLDATETIME) AS SQL_VARIANT))

将会得到以下输出：

以上VALUE属性保存了多个不同数据类型的值，可以实现要添加新的属性时不用添加列，直接保存。

但是这样查询我们希望把数据旋转为每个属性占一列的传统方式，然后再保存到临时表中处理后续查询称之为透视转换技术。在这里需要回看一下你真的会玩SQL吗？之逻辑查询处理阶段对于理解透视转换的步骤是有帮助的。

来看一看经典的行转列实例，如要得到下面的结果怎么做：

透视转换的步骤：

1. 分组：这里需要为每个对象从多个基础行来创建单独的一列数据，这意味着要对行进行分组，这里依据的是objectid列。
2. 扩展：从结果列考虑每个唯一的属性都需要一个结果列，对应的是attribute列。这里是attr1,attr2……attr5，列中包含5个表达式。
3. 聚合：从一组NULL值和已知值中提取出已知值，这就需要使用聚合操作，提取已知值技巧就是使用MAX或MIN函数，这两个会忽略NULL，并返回一个非NULL值，国为只包含一个值的集合最大值和最小值就是这个值。此处对就列是VALUE列。每组中若包含多个非NULL值，视情况也可用SUM/AVG。

参考SQL：

SELECT  objectid ,
        MAX(CASE WHEN attribute = 'attr1' THEN VALUE
            END) AS attr1 ,
        MAX(CASE WHEN attribute = 'attr2' THEN VALUE
            END) AS attr2 ,
        MAX(CASE WHEN attribute = 'attr3' THEN VALUE
            END) AS attr3 ,
        MAX(CASE WHEN attribute = 'attr4' THEN VALUE
            END) AS attr4 ,
        MAX(CASE WHEN attribute = 'attr5' THEN VALUE
            END) AS attr5
FROM    OpenSchema
GROUP BY objectid

View Code

这里也可以用PIVOT，不过PIVOT不支持动态透视转换，除了使代码更短外没有什么显著差异，这里就不演示了。

逆透视转换

即列旋转行，常用于规范化数据，如将上面的结果逆转换。

创建表：

CREATE TABLE PvtOpenSchema(
objectid INT NOT NULL,
attr1 VARCHAR(10)  NULL ,
attr2 VARCHAR(10)  NULL ,
attr3 VARCHAR(10)  NULL ,
attr4 VARCHAR(10)  NULL ,
attr5 VARCHAR(10)  NULL
)

将上面的结果插入此表：

INSERT INTO PvtOpenSchema
(
objectid,attr1,attr2,attr3,attr4,attr5
)
SELECT  objectid ,
        MAX(CASE WHEN attribute = 'attr1' THEN CAST( VALUE AS VARCHAR(10))
            END) AS attr1 ,
        MAX(CASE WHEN attribute = 'attr2' THEN  CAST( VALUE AS VARCHAR(10))
            END) AS attr2 ,
        MAX(CASE WHEN attribute = 'attr3' THEN  CAST( VALUE AS VARCHAR(10))
            END) AS attr3 ,
        MAX(CASE WHEN attribute = 'attr4' THEN  CAST( VALUE AS VARCHAR(10))
            END) AS attr4 ,
        MAX(CASE WHEN attribute = 'attr5' THEN  CAST( VALUE AS VARCHAR(10))
            END) AS attr5
FROM    OpenSchema
GROUP BY objectid

结果：

若做到逆转换，将每个objectid 和每个attribute生成结果集中的一行

第一步是为每个甚而行生成5个属性副本，可以通过基础表和每个属性占一行虚拟辅助表执行交叉联接来实现，然后用select 返回objectid和attribute，用case计算值。

可能数据源中会得到与NULL值，如1的attr4，所以还需要对结果进行过滤掉Value为NULL的。

代码如下：

SELECT  objectid ,
        attribute ,
        VALUE
FROM    ( SELECT    objectid ,
                    attribute ,
                    CASE attribute
                      WHEN 'attr1' THEN attr1
                      WHEN 'attr2' THEN attr2
                      WHEN 'attr3' THEN attr3
                      WHEN 'attr4' THEN attr4
                      WHEN 'attr5' THEN attr5
                    END AS VALUE
          FROM      PvtOpenSchema
                    CROSS JOIN ( SELECT 'attr1' AS attribute
                                 UNION ALL
                                 SELECT 'attr2'
                                 UNION ALL
                                 SELECT 'attr3'
                                 UNION ALL
                                 SELECT 'attr4'
                                 UNION ALL
                                 SELECT 'attr5'
                               ) AS attributes
        ) AS T
WHERE   VALUE IS NOT NULL

这里可以使用UNPIVOT表运算符，查询将更简单：

SELECT  objectid ,
        attribute ,
        VALUE
FROM    PvtOpenSchema UNPIVOT ( VALUE FOR attribute IN ( attr1, attr2, attr3, attr4, attr5 ) ) AS a

UNPIVOT会在一个逻辑处理中删除NULL行。

以上只是一个简单的示例，即使现在理解了但在多变的实际应用可能就会迷惘，那时再来对比看看此例。

练习：

           姓名    科目   成绩
           张三     语文    80
           张三     数学    90
           张三     物理    85
           李四     语文    85
           李四     物理    82
           李四     英语    90
           李四     政治    70
           王五     英语    90

将上表转换为：

           姓名     数学    物理     英语    语文    政治
           李四     0       82      90     85     70
           王五     0       0       90      0      0
           张三    90      85        0      80     0

时间： 2024-10-24 00:34:39

你真的会玩SQL吗？透视转换的艺术的相关文章

你真的会玩SQL吗？简单的数据修改

你真的会玩SQL吗?系列目录你真的会玩SQL吗?之逻辑查询处理阶段你真的会玩SQL吗?和平大使内连接.外连接你真的会玩SQL吗?三范式.数据完整性你真的会玩SQL吗?查询指定节点及其所有父节点的方法你真的会玩SQL吗?让人晕头转向的三值逻辑你真的会玩SQL吗?EXISTS和IN之间的区别你真的会玩SQL吗?无处不在的子查询你真的会玩SQL吗?Case也疯狂你真的会玩SQL吗?表表达式,排名函数你真的会玩SQL吗?简单的数据修改你真的会玩SQL吗?你所不知道的数据聚合

你真的会玩SQL吗？玩爆你的数据报表之存储过程编写（下）

你真的会玩SQL吗？表表达式，排名函数

你真的会玩SQL吗？无处不在的子查询

你真的会玩SQL吗？Case也疯狂

你真的会玩SQL吗？你所不知道的数据聚合

你真的会玩SQL吗？之逻辑查询处理阶段

你真的会玩SQL吗？实用函数方法汇总

你真的会玩SQL吗？和平大使内连接、外连接

猜你喜欢

Excel文档编辑里面“填空型”下划线地运用

下划线经常出现在调查或问卷中,用来指示需要填写内容的位置.在Excel中我们可以先在单元格中添加空格,然后再选中空格,单击"格式"工具栏上的"下划线"按钮来制作 ...

如何用Netfilter/IPtables限制P2P流量

今年4月,看到一则报道说尽管某宽带公司现有技术可以容纳的网络用户容量为400至600万用户,可是目前,在容纳了45万用户的情况下,网络已经拥挤不堪,时常出现断网情况,一到上网高峰,网速就会急剧下降. ...

Linux上备份Oracle数据库脚本(16.34)

oracle|备份|脚本|数据|数据库 # exp-backup.sh# initialize oracle database env variable /home/oracle/oraenv# as ...

借助C++进行Windows开发：探索高性能算法

在并发空间中,诸如协调.异步行为.响应性和可伸缩性等问题会成为关注的焦点.这些都是开发人员在设计应用程序时必须考虑的一些比较深奥的主题.但是,也许是由于缺乏经验或缺乏合适的性能工具,一些同样重要的主题 ...

Windows 8 Store Apps学习(65) 后台任务: 音乐的后台播放和控制

介绍重新想象 Windows 8 Store Apps 之后台任务音乐的后台播放和控制示例用于保存每首音乐的相关信息的对象 BackgroundTask/SongModel.cs /* * ...

如何手动查杀局域网ARP病毒

由于arp防火墙是基于应用层的,所以对局域网arp病毒仍是束手无策,前些时候邻居(同一局域网)告诉我他的电脑总是提示我对他进行攻击.不光是我,其他用户也是在互相的攻击,经常搞的网络性能恶劣下降,无奈之 ...

通过vbs修改目录名称与快捷方式名称的实现代码

这篇文章主要是分享了如果用vbs修改目录名与快捷方式名称的代码,需要的朋友可以参考下复制代码代码如下: set fso=wscript.createobject("scripting ...

办公室新手搞定Word打印的实用技巧

Word文档编辑完成后,通常就要进行打印的操作了.可是且慢,那打印操作难道真的就只有点击"打印"按钮那么简单吗?如果您对文档的打印没有任何的要求的话,那么这个打印还真的是那么简单. ...

如何将Win8自带地图程序改成中文

1. 打开控制面板,点击"更改输入法"; 2.选择"中文(中华人民共和国)",点击"上移",将中文设置为语言首选项; 3. 再打开自带的 ...

百度贴吧一键签到助手功能介绍

百度贴吧一键签到助手能设置大小吧签到处,大部分的吧就是会员每日发贴签到,该吧的会员就直接签到,非会员的还要输入验证码.一般来说,非会员没有签到的必要,签到只是会员证明对该吧的重视程度. 1.可自有 ...

中国银行网上银行怎么登录

中国银行的网址是:http://www.boc.cn 一定要记得打WWW不然会提示[这个页面暂时无法打开!(错误代码:0x800c0005)]或是百度一下[中国银行]然后点击有[官方]字样的链接, ...

JQuery ajax返回JSON时的处理方式 (三种方式)_AJAX相关

最近在使用JQuery的ajax方法时,要求返回的数据为json数据,在处理的过程中遇到下面的几个问题,那就是采用不同的方式来生成json数据的时候,在$.ajax方法中应该是如何来处理的,下面依次来 ...

android webview中注入支持图片双击的js代码无效

问题描述 android webview中注入支持图片双击的js代码无效 javascript:(function(){ var objs = document.getElementsByTagNam ...

Mac下配置apache

一.前言今天遇到问题,怎么配置apache在Mac上,原来Mac自带apache,只需要自己开启配置一下就行了. 二.步骤: 1.修改apache的http_conf文件 ...

黑客的最高境界：社会工程学拿下暗恋女孩的电脑

最近又进行了一次社会工程学的入侵.昨天晚上算是告一段落了.下面给大家分享下思路: 前几天在网上看到了4年前的初恋情人.是在逛空间的时候无意找到的.我没有她的Q,我特别想和她说话,了解她的情况,还 ...

在UBUNTU中关闭DELL N4050的ALPS触摸板

新用一台DELL INSPIRON N4050的笔记本,经常发现键盘输入的时候,输入焦点莫名其妙的移动到了别的地方.一直大惑不解,还曾经以为是我的无线鼠标受到了信号干扰,经过实验,发现关闭无线鼠标该问 ...

项目、SVN clean的一些事

1.如果你发现你的文件修改了.Tomcat也重新了,但访问的还是旧的文件,这个时候你需要clean下你的项目. Clean will discard all build problems and bu ...

jQuery入门知识简介_jquery

到目前为之jQuery已经发布到1.4.2版本,而在这之前的一个星期他们刚发布1.4版本,看看他的各个版本的发布时间 ,不难发现他的飞速发展,每个月都在更新版本:而且不断有人开发出新的 jQuery ...

文艺范豆瓣邮件客户端Mailr

硅谷网讯公文写作豆瓣通过Apps生态群将其Web产品分解并用碎片化方式一一切入移动端的做法非常有参考价值和样板意义,但在豆瓣十款移动应用中,却没有豆瓣用户使用频繁的豆邮客户端.但我在iTunes里却 ...

检索60万健康成人基因,找到了13个"基因超级英雄"

编者注: 今年4月11日,著名科学杂志Nature的子刊Nature Biotechnology发表了一片文章,介绍了纽约西奈山医学院陈荣教授及其研究团队的一项开创性的工作,他们检索了近600,0 ...

百度：别把自己看扁了

中介交易 SEO诊断淘宝客云主机技术大厅一家公司怎样才能迅速提升盈利能力?答案可能有很多,比如,加强技术创新.优化业务结构.改善管理模式.把握市场先机?? 有的公司却另有答案-靠出卖自己赚钱. ...

高效的使用 Response.Redirect解决一些不必要的问题_实用技巧

介绍: 我正在评估一个 ASP.NET Web 项目应用.它有一些可扩展性问题.意味着当网站访问量增加的时候.系统将会变得缓慢.当我查看应用日志.我找到了大量的 ThreadAbortExceptio ...

JavaScript仿微博发布信息案例_javascript技巧

现在很多类似以微博发布动态的效果,下面为一个用 JavaScript写的小小的类似微博发布信息的案例 <!DOCTYPE html> <html lang="en" ...

黑客预警：搞瘫北美互联网？规模更大的僵尸网络现身

自从上次感恩节全美大断网,我们发布了<浅析:那些能和计算机说话的小东西们,搞瘫了半个美国的网>之后,已经快一年了.这一年来,互联网安全事件从来没停过,攻防双方都在进化.不过,我们这次想说的 ...

这个程序不知为什么会抛出socket is closed异常，

问题描述 publicclasssocket{Socketsocket;publicsocket(){try{socket=newSocket("127.0.0.1",8834); ...

7000万美元收购生物识别公司EyeVerify，蚂蚁金服已锁定你眼球

还记得支付宝曾经轰动一时的"刷脸支付"吗?事实上,蚂蚁金服在生物识别的筹备上从未松懈. 据彭博社援引知情人士消息报道,阿里巴巴集团旗下蚂蚁金服以7000万美元收购了美国密苏里州堪萨 ...

stireport 报表中的表怎么没法改变。stimulsoft报表问题

问题描述我的报表里面,设计的时候有个t_StockSub表,但是执行regdata()后,报表的dictionary里面,有两个t_StockSub表?导致我的数据没法打印出来.DataSetdem ...

个人感想：说说我眼中的中国互联网

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅我,80后,一个初出茅庐的小子,看 ...

学习SEO遇到的三个重大问题

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅一.当我们优化网站的时候心里没底 ...

协和系医生集团主任朱颖：从临床经验谈协医集团对 AI 的需求与应用案例

雷锋网(公众号:雷锋网)按:医疗被认为是金融之外,人工智能另一个在短期内大有可为的市场,机器学习.图像识别.语义理解等技术的能量均可在医疗项目中得到很好地释放. 那么医生在诊疗过程中会产生哪些可以靠 ...

热搜