SQL细节之Checklist注意事项与总结

 代码如下 复制代码

/*
--注意:准备数据(可略过,非常耗时)
CREATE TABLE CHECK1_T1
(
    ID INT,
    C1 CHAR(8000)
)

CREATE TABLE CHECK1_T2
(
    ID INT,
    C1 CHAR(8000)
)

DECLARE @I INT
SET @I=1
WHILE @I<=10000
 BEGIN
    INSERT INTO CHECK1_T1 SELECT @I,'C1'
    INSERT INTO CHECK1_T2 SELECT 10000+@I,'C1'
   
    SET @I=@I+1
 END

CREATE TABLE CHECK2_T1
(
    ID INT,
    C1 CHAR(8000)
)

DECLARE @I INT
SET @I=1
WHILE @I<=10000
 BEGIN
    INSERT INTO CHECK2_T1 SELECT @I,'C1'
   
    SET @I=@I+1
 END

INSERT INTO CHECK2_T1 VALUES(10001,'C2')

INSERT INTO CHECK2_T1 VALUES(10002,'C1')

CREATE TABLE CHECK3_T1
(
    ID INT,
    C1 CHAR(7000)
)

CREATE TABLE CHECK3_T2
(
    ID INT,
    C1 CHAR(7000)
)

DECLARE @I INT
SET @I=1
WHILE @I<=20000
 BEGIN
    IF @I%2 =0
        BEGIN
            INSERT INTO CHECK3_T1 SELECT @I,'C1'
        END
    ELSE
        BEGIN
            INSERT INTO CHECK3_T1 SELECT @I,'C2'
        END
   
    IF @I%100=0
        BEGIN
            INSERT INTO CHECK3_T2 SELECT @I,'C1'
            INSERT INTO CHECK3_T2 SELECT @I+50000,'C2'   
        END   
    SET @I=@I+1
 END

CREATE TABLE CHECK4_T1
(
    ID INT,
    C1 CHAR(500),
)

DECLARE @I INT
SET @I=1
WHILE @I<=500000
 BEGIN
    IF @I%100000 =0
        BEGIN
            INSERT INTO CHECK4_T1 SELECT @I,'C2'
        END
    ELSE
        BEGIN
            INSERT INTO CHECK4_T1 SELECT @I,'C1'
        END
       
    SET @I=@I+1
 END
CREATE NONCLUSTERED INDEX NCIX_C1 ON CHECK4_T1(C1)

CREATE TABLE CHECK5_T1
(
    ID INT,
    C1 CHAR(10),
)

DECLARE @I INT
SET @I=1
WHILE @I<=10000
 BEGIN
    INSERT INTO CHECK5_T1 SELECT @I,'C1'
    IF @I%2=0
    BEGIN
        INSERT INTO CHECK5_T1 SELECT @I,'C1'
    END       
    SET @I=@I+1
 END

*/
--=====================================
--1、    Union all 代替 Union
 
DBCC DROPCLEANBUFFERS
DBCC FREEPROCCACHE

--测试一:(26s) 执行计划:表扫描->排序->合并联接
SELECT ID,C1 FROM CHECK1_T1  --1W条数据
UNION
SELECT ID,C1 FROM CHECK1_T2  --1W条数据

--测试二: (4s)  执行计划:表扫描->表扫描串联
SELECT ID,C1 FROM CHECK1_T1  --1W条数据
UNION ALL
SELECT ID,C1 FROM CHECK1_T2  --1W条数据

--总结:测试一中的union 排序和去重合并是相当耗时的,如果不要此功能,大数据时最好加上ALL

--=====================================
--2、    Exists 代替 Count(*)
DBCC DROPCLEANBUFFERS
DBCC FREEPROCCACHE

----测试一:  (7s) 执行计划:表扫描-> 流聚合-> 计算矢量
 DECLARE @COUNT INT
 SELECT @COUNT=COUNT(*) FROM CHECK2_T1 WHERE C1='C1'  --1W条数据
 IF @COUNT>0
    BEGIN  
        PRINT 'S'
    END
----测试二:  (0s) 执行计划:常量扫描/表扫描-> 嵌套循环-> 计算标量
 IF EXISTS(SELECT 1 FROM CHECK2_T1 WHERE C1='C1')  --1W条数据
    BEGIN
        PRINT 'S'
    END
   
--总结:判断是否存在,用Exist即可,没必要用COUNT(*)将表的所有记录统计出来,扫描一次
   
--=====================================
--3、    IN(Select COL1 From Table)的代替方式
DBCC DROPCLEANBUFFERS
DBCC FREEPROCCACHE

--测试一: (3s)执行计划:表扫描 -> 哈希匹配
SELECT ID,C1 FROM CHECK3_T2  --400行
WHERE ID IN (SELECT ID FROM CHECK3_T1 WHERE C1='C1')  --2W行

--测试二:(1s)执行计划:表扫描-> 并行度 -> 位图 -> 排序 -> 合并联接 -> 并行度
SELECT A.ID,A.C1 FROM CHECK3_T2 A 
INNER  JOIN CHECK3_T1 B ON A.ID=B.ID WHERE B.C1='C1' 

--测试三:(3s)执行计划:表扫描-> 哈希匹配
SELECT A.ID,A.C1 FROM CHECK3_T2 A
WHERE EXISTS (SELECT 1 FROM CHECK3_T1 B WHERE B.ID=A.ID AND B.C1='C1')

--总结:能用INNER JOIN 尽量用它,SQL SERVER在查询时会将关联表进行优化

--=====================================
--4、    Not Exists 代替 Not In
--测试一:(8s) 执行计划:表扫描-> 嵌套循环 -> 哈希匹配
SELECT ID,C1 FROM CHECK3_T1  --2W行
WHERE ID NOT IN (SELECT ID FROM CHECK3_T2 WHERE C1='C1')  --400行

--测试二:(4s) 执行计划:表扫描-> 哈希匹配
SELECT A.ID,A.C1 FROM CHECK3_T1 A
WHERE NOT EXISTS (SELECT 1 FROM CHECK3_T2 B WHERE B.ID=A.ID AND B.C1='C1')

--总结:尽量不使用NOT IN ,因为会调用嵌套循环,建议使用NOT EXISTS代替NOT IN

--=====================================
--5、    避免在条件列上使用任何函数

DROP TABLE CHECK4_T1
 
CREATE NONCLUSTERED INDEX NCIX_C1 ON CHECK4_T1(C1) --加上非聚集索引

---测试一:(4s)执行计划: 索引扫描
SELECT * FROM CHECK4_T1 WHERE RTRIM(C1)='C2'

---测试二:(0s)执行计划: 索引查找
SELECT * FROM CHECK4_T1 WHERE C1='C2'

--总结:where条件里对索引字段使用了函数,会使索引查找变成索引扫描,从而查询效率大幅下降

--=====================================
--6、    用sp_executesql执行动态sql
 
DBCC DROPCLEANBUFFERS
DBCC FREEPROCCACHE
 
CREATE PROC UP_CHECK5_T1 (
  @ID INT
)
AS
    SET NOCOUNT ON

    DECLARE @count INT,
            @sql   NVARCHAR(4000)

    SET @sql = 'SELECT @count=count(*) FROM CHECK5_T1 WHERE ID = @ID'

    EXEC sp_executesql @sql,
                       N'@count INT OUTPUT, @ID int',
                       @count OUTPUT,
                       @ID

    PRINT @count

   
CREATE PROC UP_CHECK5_T2 (
  @ID INT
)
AS
    SET NOCOUNT ON

    DECLARE @sql NVARCHAR(4000)

    SET @sql = 'DECLARE @count INT;SELECT @count=count(*) FROM CHECK5_T1 WHERE ID = ' + CAST(@ID AS VARCHAR(10)) + ';PRINT @count'

    EXEC(@sql)

---测试一:瞬时
DECLARE @N INT
SET @N=1
WHILE @N<=1000
BEGIN
    EXEC UP_CHECK5_T1 @N
    SET @N=@N+1
END

---测试二:2s
DECLARE @N INT
SET @N=1
WHILE @N<=1000
BEGIN
    EXEC UP_CHECK5_T2 @N
    SET @N=@N+1
END

CREATE CLUSTERED INDEX CIX_ID ON CHECK5_T1(ID)

DBCC DROPCLEANBUFFERS
DBCC FREEPROCCACHE

--查看缓存计划
SELECT a.size_in_bytes                                                                               '占用字节数',
       total_elapsed_time / execution_count                                                          '平均时间',
       total_logical_reads / execution_count                                                         '逻辑读',
       usecounts                                                                                     '重用次数',
       SUBSTRING(d.text, (statement_start_offset / 2) + 1, ((CASE statement_end_offset
                                                               WHEN -1 THEN DATALENGTH(text)
                                                               ELSE statement_end_offset
                                                             END - statement_start_offset) / 2) + 1) '语句'
FROM   sys.dm_exec_cached_plans a
       CROSS apply sys.dm_exec_query_plan(a.plan_handle) c,
       sys.dm_exec_query_stats b
       CROSS apply sys.dm_exec_sql_text(b.sql_handle) d
WHERE  a.plan_handle = b.plan_handle
ORDER  BY total_elapsed_time / execution_count DESC;

--总结:通过执行下面缓存计划可以看出,第一种完全使用了缓存计划,查询达到了很好的效果;
--而第二种则将缓存计划浪费了,导致缓存很快被占满,这种做法是相当不可取的

--=====================================
--7、    Left Join 的替代法
--测试一 执行计划:表扫描 -> 哈希匹配
SELECT A.ID,A.C1 FROM CHECK3_T1 A   --2W行
LEFT JOIN CHECK3_T2 B ON A.ID=B.ID WHERE B.C1='C1'  --400行

--测试二 执行计划:表扫描 -> 哈希匹配
SELECT A.ID,A.C1 FROM CHECK3_T1 A
RIGHT JOIN CHECK3_T2 B ON A.ID=B.ID WHERE a.C1='C1'

--测试三 执行计划:表扫描 -> 哈希匹配
SELECT A.ID,A.C1 FROM CHECK3_T1 A
INNER JOIN CHECK3_T2 B ON A.ID=B.ID WHERE B.C1='C1'

--总结:三条语句,在执行计划上完全一样,都是走的INNER JOIN的计划,
--因为测试一和测试二中,WHERE语句都包含了LEFT 和RIGHT表的字段,SQLSERVER若发现只要有这个表的字段,则会自动按照INNER JOIN进行处理

--补充测试:(1s)执行计划:表扫描-> 并行度 -> 位图 -> 排序 -> 合并联接 -> 并行度
SELECT A.ID,A.C1 FROM CHECK3_T2 A  --400行
INNER  JOIN CHECK3_T1 B ON A.ID=B.ID WHERE A.C1='C1'  --2W行
--总结:这里有一个比较有趣的地方,若主表和关联表数据差别很大时,走的执行计划走的另一条路

--=====================================
--8、    ON(a.id=b.id AND a.tag=3)
--测试一
SELECT A.ID,A.C1 FROM CHECK3_T1 A
INNER JOIN CHECK3_T2 B ON A.ID=B.ID AND A.C1='C1'

--测试二
SELECT A.ID,A.C1 FROM CHECK3_T1 A
INNER JOIN CHECK3_T2 B ON A.ID=B.ID WHERE A.C1='C1'

--总结:内连接:无论是左表和右表的筛选条件都可以放到WHERE子句中

--测试一
SELECT A.ID,A.C1,B.C1 FROM CHECK3_T1 A
LEFT JOIN CHECK3_T2 B ON A.ID=B.ID AND B.C1='C1'

--测试二
SELECT A.ID,A.C1,B.C1 FROM CHECK3_T1 A
LEFT JOIN CHECK3_T2 B ON A.ID=B.ID WHERE B.C1='C1'

--总结:左外连接:当右表中的过滤条件放入ON子句后和WHERE子句后的结果不一样

--=====================================
--9、   赋值给变量,加Top 1
--测试一:(3s) 执行计划:表扫描
DECLARE @ID INT
SELECT @ID=ID FROM CHECK1_T1 WHERE C1='C1'
SELECT @ID

--测试二:(0s)执行计划:表扫描-> 前几行
DECLARE @ID INT
SELECT TOP 1 @ID=ID FROM CHECK1_T1 WHERE C1='C1'
SELECT @ID

--总结:给变量赋值最好都加上TOP 1,一从查询效率上增强,二为了准确性,若表CHECK1_T1有多个值,则会取最后一条记录赋给@ID

--=====================================
--10、   考虑是否适合用CASE语句
DECLARE @S INT=1
SELECT * FROM CHECK5_T1
WHERE C1=(CASE @S WHEN 1 THEN C1 ELSE 'C2' END)

SELECT * FROM CHECK5_T1
WHERE @S=1 OR C1='C2'

/*--=====================================
、检查语句是否需要Distinct.  执行计划:表扫描-> 哈希匹配-> 并行度-> 排序
select distinct c1 from CHECK3_T1
、禁用Select *,指定具体列名
select c1 from CHECK4_T1
select * from CHECK4_T1
、Insert into Table(*),指定具体的列名
、Isnull,没有必要的时候不要对字段使用isnull,同样会产生无法有效利用索引的问题,
    和避免在筛选列上使用函数同样的原理。
、嵌套子查询,加上查询条件,确保子查询的结果集最小
--=====================================*/

本周技术研究部(TRD)的一名DBA 对我们编写SQL时的一些问题,进行了汇报讲演,以下是来自它的脚本,我在它讲演的基础上写出了自己想表述的,以便于大家相互交流学习

时间: 2024-11-03 00:44:20

SQL细节之Checklist注意事项与总结的相关文章

关于SQL Server的若干注意事项

server 关于SQL Server的若干注意事项         如果你正在负责一个基于SQL Server的项目,或者你刚刚接触SQL Server,你都有可能要面临一些数据库性能的问题,这篇文章会为你提供一些有用的指导(其中大多数也可以用于其它的DBMS).         在这里,我不打算介绍使用SQL Server的窍门,也不能提供一个包治百病的方案,我所做的是总结一些经验----关于如何形成一个好的设计.这些经验来自我过去几年中经受的教训,一直来,我看到许多同样的设计错误被一次又一

ACCESS转SQL server需注意的事项

关于ACCESS数据库转换成SQL数据库后的问题还是挺多的,所以今天笔者在中国专业站长网中有必要跟大家讲述一下有关ACCESS转SQL的相关注意事项:      1.数据库导入以后,自动增加字段需要重写,所有的数字类型需要增加长度,最好用decimal.     2.所有的默认值都丢失了.主要是数字类型和日期类型.     3.所有now(),time(),date()要改成getdate().     4.所有datediff('d', time1, time2)要改成datediff(day

安装SQL SERVER 2000的注意事项

server 正确这些注意事项是安装SQL SERVER 2000的前提和保障: 1.关闭所有可能与SQL SERVER 2000系统有关的服务和应用程序.这包括所有利用到ODBC的应用程序,以及WINDOWS NT自带的IIS. 2.如果正在WINDOWS NT的事件查看器,先关闭该查看器. 3.如果运行管理或修改注册表的任何程序,如REGEDIT32,请先关闭. 4.如果是在WINDOWS NT上安装SQL SERVER 2000,并且希望以后能运行在服务器之间相互通讯的程序和服务,那么事先

程序员必看:关于SQL Server的若干注意事项

server|程序|程序员 如果你正在负责一个基于SQL Server的项目,或者你刚刚接触SQL Server,你都有可能要面临一些数据库性能的问题,这篇文章会为你提供一些有用的指导(其中大多数也可以用于其它的DBMS). 在这里,我不打算介绍使用SQL Server的窍门,也不能提供一个包治百病的方案,我所做的是总结一些经验----关于如何形成一个好的设计.这些经验来自我过去几年中经受的教训,一直来,我看到许多同样的设计错误被一次又一次的重复. 你了解你用的工具吗? 不要轻视这一点,这是我在

SQL 复制过程的注意事项

过程 1.设置共享复制目录:        \\computer_machine\C$...\..如果服务器取消过默认的共享($)则会失败:此时新建一个目录,并赋予权限,目录改为:\\computer_machine\共享目录名 2.建立用于发布应用的windows账号 3.在配置分发服务器时遭遇了 错误18483 提示因为distributor_admin未在该服务器上定义为远程登陆,故无法创建解决方法:(运行以下程序)USE masterGO--设置两个变量DECLARE @serverpr

jdbc连接SQL Server数据库的注意事项及编程应用实例

首先,关于数据库的安装方法在本文中就不再累赘,详情请见我的上一篇博客. http://cq520.iteye.com/admin/blogs/1982097 不过需要注意的是,由于装有Windows操作系统下的电脑都默认有SQL Server,所以大家可以打开自己 的电脑看一下自己的电脑里面是哪个SQL Server 版本(在开始菜单中找到Microsoft SQL Server文件夹 ,后面的版本号就是本机的SQL Server 版本). 不过系统自带的SQL Server可能并没有管理工具(

SQL Server 2012 安装图解教程(附sql2012下载地址)_MsSql

在安装微软最新数据库SQL Server 2012之前,编者先确定一下安装环境:Windonws 7 SP1,32位操作系统.CPU是2.1GHz赛扬双核T3500,内存2.93GB. sql2012下载 http://www.jb51.net/softs/79861.html 安装SQL Server 2012的软硬件环境参数 根据微软的下载提示,32位的Windows 7操作系统,只需下载列表最下面的CHSx86SQLFULL_x86_CHS_Core.box. CHSx86SQLFULL_

SQL Server 2012 安装图解教程(附sql2012下载地址)

在安装微软最新数据库SQL Server 2012之前,编者先确定一下安装环境:Windonws 7 SP1,32位操作系统.CPU是2.1GHz赛扬双核T3500,内存2.93GB. sql2012下载 http://www.jb51.net/softs/79861.html 安装SQL Server 2012的软硬件环境参数 根据微软的下载提示,32位的Windows 7操作系统,只需下载列表最下面的CHSx86SQLFULL_x86_CHS_Core.box. CHSx86SQLFULL_

详解升级到SQL Server 2008的步骤

必备项 对于本地安装,必须以管理员身份运行安装程序.如果从远程共享安装 SQL Server,则必须使用对远程共享具有读取和执行权限的域帐户. 升级数据库引擎之前,请先查看以下主题: 升级到SQL Server 2008 安装 SQL Server 2008 的硬件和软件要求 系统配置检查器的检查参数 安装 SQL Server 的安全注意事项 SQL Server 数据库引擎的向后兼容性 注意:如果受到安装程序中的已知问题的影响,可能需要在安装 SQL Server 2008 之前对原始媒体应