Unicode字段也有collation

原文:Unicode字段也有collation

转自：http://blogs.msdn.com/b/apgcdsd/archive/2011/01/11/unicode-collation.aspx

一个常常让人困惑的问题就是,为什么SQL Server 的Unicode 字段(nvarchar/nchar/ntext)也有collation定义呢？Unicode字段不是可以存储多语言吗？比如下面的表定义：

CREATE TABLE tt１

(

c1 int,

c2 nvarchar(10) collate Chinese_PRC_Stroke_CI_AS

)

上门的c2 字段是nvarchar类型，那么加的collate Chinese_PRC_Stroke_CI_AS有啥意义呢。　或许你会问，如果我不加上collate不就行啦. 其实如果没有后面的collate, SQL server 会缺省给你加上数据库的collation. 也就是说nvarchar/nchar等字段一定是有collation的.

那么上面定义的collate有何意义?是否就是指这个c2字段只能存放中文字符呢?不是. Unicode 的collation 的作用是排序规则. 就是说, 这个字段依旧可以存放多国语言,但是你只能指定一种排序规则,如上面的table, 我指定的排序规则就是按照中文排序,即使你存放的是别的语言..

让我们看一看例子:

IF OBJECT_ID ('tt1','U') IS NOT NULL

drop table tt1

CREATE TABLE tt1

(

c1 int,

c2 nvarchar(10) collate Chinese_PRC_Stroke_CI_AS

)

INSERT tt1 VALUES (1, N'一');

INSERT tt1 VALUES (2, N'二');

INSERT tt1 VALUES (3, N'三');

INSERT tt1 VALUES (4, N'四');

select * from tt1 order by c2

结果如下:

c1 c2

----------- ----------

1 一

2 二

3 三

4 四

(4 row(s) affected)

你可以看到c2列的排序结果不错. 如果我们使用另外一种collation, 那么结果可能是不同的,让我们看看:

IF OBJECT_ID ('tt1','U') IS NOT NULL

drop table tt1

CREATE TABLE tt1

(

c1 int,

c2 nvarchar(10) collate latin1_general_cs_as

)

INSERT tt1 VALUES (1, N'一');

INSERT tt1 VALUES (2, N'二');

INSERT tt1 VALUES (3, N'三');

INSERT tt1 VALUES (4, N'四');

select * from tt1 order by c2

结果是不一样的, C2列的order by 结果和上面是有差异的:

c1 c2

----------- ----------

1 一

3 三

2 二

4 四

(4 row(s) affected)

时间： 2024-09-30 07:48:23

Unicode字段也有collation

Unicode字段也有collation的相关文章

MongoDB 3.4 Collation 特性解析

手动建立 Oracle9i 数据库

【阿里在线技术峰会】罗龙九：云数据库十大经典案例分析

阿里云慢SQL优化挑战大赛分析

SQL优化 · 经典案例 · 索引篇

关于ado的乱码

SQL Server的排序规则(collation)冲突和解决方案

查看mysql字符集及修改表结构--表字符集，字段字符集

PostgreSQL 10.0 preview 功能增强 - 国际化功能增强,支持ICU(International Components for Unicode)