sql中IN与EXISTS,NOT IN与NOT EXISTS的详细介绍

强调下:在含有NULL值的列的时候,就要小心了,not exists与not in在逻辑上是不等价的
--先创建2张表

 代码如下 复制代码

use master;

if db_id('DbTest') is not null drop database DbTest;

create database DbTest;
go

use DbTest;
go

--创建Customers表
create table Customers
(
  custid       INT          NOT NULL IDENTITY,
  companyname  NVARCHAR(40) NOT NULL,
  country      NVARCHAR(15) NOT NULL,
  constraint pk_customer primary key(custid)
);

--创建Orders表

 代码如下 复制代码

CREATE TABLE Orders
(
  orderid        INT          NOT NULL IDENTITY,
  custid         INT          NULL,
 
  CONSTRAINT PK_Orders PRIMARY KEY(orderid),
  CONSTRAINT FK_Orders_Customers FOREIGN KEY(custid)
  REFERENCES Customers(custid),
 
);
  set identity_insert Customers on;

  INSERT INTO Customers(custid, companyname,country)
  VALUES(1, N'大众', N'中国');
  INSERT INTO Customers(custid, companyname,country)
  VALUES(2, N'宝马', N'美国');
  INSERT INTO Customers(custid, companyname,country)
  VALUES(3, N'奔驰', N'中国');
  INSERT INTO Customers(custid, companyname,country)
  VALUES(4, N'奇瑞', N'德国');
  INSERT INTO Customers(custid, companyname,country)
  VALUES(5, N'福特', N'美国');
 
  set identity_insert Customers off;
  set identity_insert Orders on;
--custid代表员工号
  INSERT INTO Orders(orderid, custid)
  VALUES(1,1);
  INSERT INTO Orders(orderid, custid)
  VALUES(2,2);
  INSERT INTO Orders(orderid, custid)
  VALUES(3,3);
  INSERT INTO Orders(orderid, custid)
  VALUES(4,4);
  INSERT INTO Orders(orderid, custid)
  VALUES(5,5);
--查看表的数据
select custid,companyname,country from Customers;
select orderid,custid from Orders;
--插入数据成功

--咱们回到正题,比较Exists与in,not exists与 not in

--查询来自中国,而且下过订单的所有客户

 代码如下 复制代码
select custid,companyname
from Customers as C
where country=N'中国'
and exists (select * from Orders as O where O.custid=C.custid);
--返回
--custid    companyname
--1            大众
--3            奔驰

--外部查询返回来自中国的客户信息,对于这个客户,exists谓词在Orders表查找是否至少存在一个与外部客户行信息相同的custid订单行

--用IN查询刚刚的需求

 代码如下 复制代码
select custid,companyname
from Customers as C
where country=N'中国'
and custid in(select custid from Orders);

--结果跟上面的返回一样的值

--下面的知识点我们需要认识到:
--当列表中有NULL时,in实际会产生一个UNKNOWN的结果,例如 a in(d,b,null)的结果是UNKNOWN,而a not in (d,b,null)返回的是not unknowd仍然是unknowd
--而not in与not exists则结果会很不同,例如a in(a,b,null)返回的是TRUE,而a not in(a,b,null)返回的肯定是not true即为false
--有了上面的认识,好继续开工了....
--我们现在向Orders表插入一行数据(6,null)

 代码如下 复制代码

set identity_insert Orders on;

insert into Orders(orderid,custid) values(6,null);

set identity_insert Orders off;

set identity_insert Customers on;

insert into Customers(custid,companyname,country) values(7,N'雷克萨斯',N'美国');

set identity_insert Customers off;

select * from Orders;
select * from Customers;

--假设现在要返回来自美国且没有订单的客户

 代码如下 复制代码
select custid,companyname
from Customers as C
where country=N'美国'
and not exists (select * from Orders as O where O.custid=C.custid );
--返回
--custid    companyname
--7            雷克萨斯

--我们再用IN方法

 代码如下 复制代码
select custid,companyname
from Customers as C
where country=N'美国'
and custid not in(select custid from Orders);

--返回的结果为空!!!
--为什么呢??
--因为还记得我们刚插入的一行数据中custid为null么,这就是问题所在
--not in (select custid from Orders)返回的实际是unknown,所以返回结果集为空,除非你显示的规定custid不能为空

--下面是正确的解决方法

 代码如下 复制代码
select custid,companyname
from Customers as C
where country=N'美国'
and custid not in (select custid from Orders where custid is not null);
--返回
--custid    companyname
--7            雷克萨斯

--所以在含有NULL值的列的时候,就要小心了,not exists与not in在逻辑上是不等价的

in适合内外表都很大的情况,exists适合外表结果集很小的情况。
exists 和 in 使用一例
===========================================================
今天市场报告有个sql及慢,运行需要20多分钟,如下:

 代码如下 复制代码
update p_container_decl cd
set cd.ANNUL_FLAG='0001',ANNUL_DATE = sysdate
where exists(
select 1
from (
select tc.decl_no,tc.goods_no
from p_transfer_cont tc,P_AFFIRM_DO ad
where tc.GOODS_DECL_NO = ad.DECL_NO
and ad.DECL_NO = 'sssssssssssssssss'
) a
where a.decl_no = cd.decl_no
and a.goods_no = cd.goods_no
)

上面涉及的3个表的记录数都不小,均在百万左右。根据这种情况,我想到了前不久看的tom的一篇文章,说的是exists和in的区别,
in 是把外表和那表作hash join,而exists是对外表作loop,每次loop再对那表进行查询。
这样的话,in适合内外表都很大的情况,exists适合外表结果集很小的情况。

而我目前的情况适合用in来作查询,于是我改写了sql,如下:

 代码如下 复制代码
update p_container_decl cd
set cd.ANNUL_FLAG='0001',ANNUL_DATE = sysdate
where (decl_no,goods_no) in
(
select tc.decl_no,tc.goods_no
from p_transfer_cont tc,P_AFFIRM_DO ad
where tc.GOODS_DECL_NO = ad.DECL_NO
and ad.DECL_NO = ‘ssssssssssss’
)

让市场人员测试,结果运行时间在1分钟内。问题解决了,看来exists和in确实是要根据表的数据量来决定使用。

请注意not in 逻辑上不完全等同于not exists,如果你误用了not in,小心你的程序存在致命的BUG:

请看下面的例子:

 代码如下 复制代码

create table t1 (c1 number,c2 number);
create table t2 (c1 number,c2 number);

insert into t1 values (1,2);
insert into t1 values (1,3);
insert into t2 values (1,2);
insert into t2 values (1,null);

select * from t1 where c2 not in (select c2 from t2);
no rows found
select * from t1 where not exists (select 1 from t2 where t1.c2=t2.c2);
c1 c2
1 3

正如所看到的,not in 出现了不期望的结果集,存在逻辑错误。如果看一下上述两个select语句的执行计划,也会不同。后者使用了hash_aj。
因此,请尽量不要使用not in(它会调用子查询),而尽量使用not exists(它会调用关联子查询)。如果子查询中返回的任意一条记录含有空值,则查询将不返回任何记录,正如上面例子所示。
除非子查询字段有非空限制,这时可以使用not in ,并且也可以通过提示让它使用hasg_aj或merge_aj连接。

接着看

SQL中IN,NOT IN,EXISTS,NOT EXISTS的用法和差别:
  IN:确定给定的值是否与子查询或列表中的值相匹配。
  IN 关键字使您得以选择与列表中的任意一个值匹配的行。
  当要获得居住在 California、Indiana 或 Maryland 州的所有作者的姓名和州的列表时,就需要下列查询:
 

 代码如下 复制代码
 SELECT ProductID, ProductName FROM Northwind.dbo.Products WHERE CategoryID = 1 OR CategoryID = 4 OR CategoryID = 5

  然而,如果使用 IN,少键入一些字符也可以得到同样的结果:
  

 代码如下 复制代码
SELECT ProductID, ProductName FROM Northwind.dbo.Products WHERE CategoryID IN (1, 4, 5)

  IN 关键字之后的项目必须用逗号隔开,并且括在括号中。
  下列查询在 titleauthor 表中查找在任一种书中得到的版税少于 50% 的所有作者的 au_id,然后从 authors 表中选择 au_id 与
  titleauthor 查询结果匹配的所有作者的姓名:
 

 代码如下 复制代码
 SELECT au_lname, au_fname FROM authors WHERE au_id IN (SELECT au_id FROM titleauthor WHERE royaltyper <50)

  结果显示有一些作者属于少于 50% 的一类。
  NOT IN:通过 NOT IN 关键字引入的子查询也返回一列零值或更多值。
  以下查询查找没有出版过商业书籍的出版商的名称。
  

 代码如下 复制代码
SELECT pub_name FROM publishers WHERE pub_id NOT IN (SELECT pub_id FROM titles WHERE type = 'business')

  使用 EXISTS 和 NOT EXISTS 引入的子查询可用于两种集合原理的操作:交集与差集。两个集合的交集包含同时属于两个原集合的所有元素。
  差集包含只属于两个集合中的第一个集合的元素。
  EXISTS:指定一个子查询,检测行的存在。
  本示例所示查询查找由位于以字母 B 开头的城市中的任一出版商出版的书名:
  

 代码如下 复制代码
SELECT DISTINCT pub_name FROM publishers WHERE EXISTS (SELECT * FROM titles WHERE pub_id = publishers.pub_id AND type =
  'business')
  SELECT distinct pub_name FROM publishers WHERE pub_id IN (SELECT pub_id FROM titles WHERE type = 'business')

两者的区别:
  EXISTS:后面可以是整句的查询语句如:SELECT * FROM titles
  IN:后面只能是对单列:SELECT pub_id FROM titles
  NOT EXISTS:
  例如,要查找不出版商业书籍的出版商的名称:
 

 代码如下 复制代码
 SELECT pub_name FROM publishers WHERE NOT EXISTS (SELECT * FROM titles WHERE pub_id = publishers.pub_id AND type =
  'business')

  下面的查询查找已经不销售的书的名称:

 代码如下 复制代码
  SELECT title FROM titles WHERE NOT EXISTS (SELECT title_id FROM sales WHERE title_id = titles.title_id)
时间: 2024-07-29 00:13:18

sql中IN与EXISTS,NOT IN与NOT EXISTS的详细介绍的相关文章

mysql中int、bigint、smallint 和 tinyint的区别详细介绍_Mysql

最近使用mysql数据库的时候遇到了多种数字的类型,主要有int,bigint,smallint和tinyint.其中比较迷惑的是int和smallint的差别.今天就在网上仔细找了找,找到如下内容,留档做个总结: 使用整数数据的精确数字数据类型. bigint 从 -2^63 (-9223372036854775808) 到 2^63-1 (9223372036854775807) 的整型数据(所有数字).存储大小为 8 个字节. P.S. bigint已经有长度了,在mysql建表中的len

SQL中Exists的用法

比如在Northwind数据库中有一个查询为 SELECT c.CustomerId,CompanyName FROM Customers c WHERE EXISTS( SELECT OrderID FROM Orders o WHERE o.CustomerID=c.CustomerID) 这里面的EXISTS是如何运作呢?子查询返回的是OrderId字段,可是外面的查询要找的是CustomerID和CompanyName字段,这两个字段肯定不在OrderID里面啊,这是如何匹配的呢? EX

sql中的like统配符

LIKE确定给定的字符串是否与指定的模式匹配.模式可以包含常规字符和通配符字符.模式匹配过程中,常规字符必须与字符串中指定的字符完全匹配.然而,可使用字符串的任意片段匹配通配符.与使用 = 和 != 字符串比较运算符相比,使用通配符可使 LIKE 运算符更加灵活.如果任何参数都不属于字符串数据类型,Microsoft SQL Server 会将其转换成字符串数据类型(如果可能).语法match_expression [ NOT ] LIKE pattern [ ESCAPE escape_cha

求解在SQL中使用了where列所遇到的问题

问题   我原先用MDB的数据库,用ASP写的一个系统. 由于没有经验,使用了where字段. 最近由于需要把数据库导成SQL的,导成功之后.我在调试时发现很多的使用了"rs.update"的代码会提示在where附近有语法错误.郁闷的我查了很多资料,同时也自己试了大半天.直到下午我才最终肯定,是where字段出了问题. 调试的结论是用update语句可以,但就是不能用rs.update来实现更新:更名正常,但工作量太大:删去正常,但不能删.在7917375群内和气气等人讨论好长时间也

Spark SQL中的数据源

Spark 支持通过 DataFrame 来操作大量的数据源,包括外部文件(如 json.avro.parquet.sequencefile 等等).hive.关系数据库.cassandra 等等. 本文测试环境为 Spark 1.3. 加载和保存文件 最简单的方式是调用 load 方法加载文件,默认的格式为 parquet,你可以修改 spark.sql.sources.default 指定默认的格式: scala> val df = sqlContext.load("people.pa

sql中case语句的用法浅谈_MsSql

SQL中Case的使用方法 Case具有两种格式.简单Case函数和Case搜索函数. 复制代码 代码如下: --简单Case函数 CASE sex          WHEN '1' THEN '男'          WHEN '2' THEN '女' ELSE '其他' END --Case搜索函数 CASE WHEN sex = '1' THEN '男'          WHEN sex = '2' THEN '女' ELSE '其他' END 这两种方式,可以实现相同的功能.简单Ca

SQL中遇到多条相同内容只取一条的最简单实现方法_MsSql

SQL中经常遇到如下情况,在一张表中有两条记录基本完全一样,某个或某几个字段有些许差别, 这时候可能需要我们踢出这些有差别的数据,即两条或多条记录中只保留一项. 如下:表timeand 针对time字段相同时有不同total和name的情形,每当遇到相同的则只取其中一条数据,最简单的实现方法有两种 1.select time,max(total) as total,name from timeand group by time;//取记录中total最大的值 或 select time,min(

《交互式程序设计 第2版》一3.8 SQL中的表

3.8 SQL中的表 注意:在本节中,提到"表"一词我指的都是表值(即SQL表值),而不是表变量(就是CREATE TABLE和CREATE VIEW创建的那个).第5章会讨论表变量.第2章说过,SQL中实际上根本没有什么东西能类比于关系的关系类型:相反,一个SQL表只是某种类型的行的集合(一般是行的包而未必是集合).所以,尽管从第2章可知SQL支持其他类型生成器(包括ROW.ARRAY和MULTISET),但SQL还真没什么能类比于RELATION类型生成器.不过,SQL有表值构造器

SQL中遇到多条相同内容只取一条的最简单实现方法

SQL中经常遇到如下情况,在一张表中有两条记录基本完全一样,某个或某几个字段有些许差别, 这时候可能需要我们踢出这些有差别的数据,即两条或多条记录中只保留一项. 如下:表timeand 针对time字段相同时有不同total和name的情形,每当遇到相同的则只取其中一条数据,最简单的实现方法有两种 1.select time,max(total) as total,name from timeand group by time;//取记录中total最大的值 或 select time,min(