深入理解mysql SET NAMES和mysql(i)_set_charset的区别_Mysql

说到, 尽量使用mysqli_set_charset(mysqli:set_charset)而不是”SET NAMES”, 当然, 这个内容在PHP手册中也有叙及, 但是却没有解释为什么.
  最近有好几个朋友问我这个问题, 到底为什么?
  问的人多了, 我也就觉得可以写篇blog, 专门介绍下这部分的内容了.
  首先, 很多人都不知道”SET NAMES”到底是做了什么,
  我之前的文章深入MySQL字符集设置中, 曾经介绍过character_set_client/character_set_connection/character_set_results这三个MySQL的”环境变量”, 这里再简单介绍下,
  这三个变量, 分别告诉MySQL服务器, 客户端的编码集, 在传输给MySQL服务器的时候的编码集, 以及期望MySQL返回的结果的编码集.
  比如, 通过使用”SET NAMES utf8″, 就告诉服务器, 我用的是utf-8编码, 我希望你也给我返回utf-8编码的查询结果.
  一般情况下, 使用”SET NAMES”就足够了, 也是可以保证正确的. 那么为什么手册又要说推荐使用mysqli_set_charset(PHP>=5.0.5)呢?
  首先, 我们看看mysqli_set_charset到底做了什么(注意星号注释处, mysql_set_charset类似):

复制代码 代码如下:

  //php-5.2.11-SRC/ext/mysqli/mysqli_nonapi.c line 342
  PHP_FUNCTION(mysqli_set_charset)
  {
  MY_MYSQL *mysql;
  zval *mysql_link;
  char *cs_name = NULL;
  unsigned int len;
  if (zend_parse_method_parameters(ZEND_NUM_ARGS() TSRMLS_CC, getThis()
  , "Os", &mysql_link, mysqli_link_class_entry, &cs_name, &len) == FAILURE) {
  return;
  }
  MYSQLI_FETCH_RESOURCE(mysql, MY_MYSQL*, &mysql_link, "mysqli_link"
  , MYSQLI_STATUS_VALID);
  if (mysql_set_character_set(mysql->mysql, cs_name)) {
  //** 调用libmysql的对应函数
  RETURN_FALSE;
  }
  RETURN_TRUE;
  }

  那mysql_set_character_set又做了什么呢?

复制代码 代码如下:

  //mysql-5.1.30-SRC/libmysql/client.c, line 3166:
  int STDCALL mysql_set_character_set(MYSQL *mysql, const char *cs_name)
  {
  struct charset_info_st *cs;
  const char *save_csdir= charsets_dir;
  if (mysql->options.charset_dir)
  charsets_dir= mysql->options.charset_dir;
  if (strlen(cs_name) < MY_CS_NAME_SIZE &&
  (cs= get_charset_by_csname(cs_name, MY_CS_PRIMARY, MYF(0))))
  {
  char buff[MY_CS_NAME_SIZE + 10];
  charsets_dir= save_csdir;
  /* Skip execution of "SET NAMES" for pre-4.1 servers */
  if (mysql_get_server_version(mysql) < 40100)
  return 0;
  sprintf(buff, "SET NAMES %s", cs_name);
  if (!mysql_real_query(mysql, buff, strlen(buff)))
  {
  mysql->charset= cs;
  }
  }
  //以下省略

  我们可以看到, mysqli_set_charset除了做了”SET NAMES”以外, 还多做了一步:

复制代码 代码如下:

  sprintf(buff, "SET NAMES %s", cs_name);
  if (!mysql_real_query(mysql, buff, strlen(buff)))
  {
  mysql->charset= cs;
  }

  而对于mysql这个核心结构的成员charset又有什么作用呢?
  这就要说说mysql_real_escape_string()了, 这个函数和mysql_escape_string的区别就是, 它会考虑”当前”字符集. 那么这个当前字符集从哪里来呢?
  对了, 你猜的没错, 就是mysql->charset.
  mysql_real_string在判断宽字符集的字符的时候, 就根据这个成员变量来分别采用不同的策略, 比如如果是utf-8, 那么就会采用libmysql/ctype-utf8.c.
  看个实例, 默认mysql连接字符集是latin-1, (经典的5c问题):

复制代码 代码如下:

  <?php
  $db = mysql_connect('localhost:3737', 'root' ,'123456');
  mysql_select_db("test");
  $a = "\x91\x5c";//"慭"的gbk编码, 低字节为5c, 也就是ascii中的"\"
  var_dump(addslashes($a));
  var_dump(mysql_real_escape_string($a, $db));
  mysql_query("set names gbk");
  var_dump(mysql_real_escape_string($a, $db));
  mysql_set_charset("gbk");
  var_dump(mysql_real_escape_string($a, $db));
  ?>

  因为, “慭”的gbk编码低字节为5c, 也就是ascii中的”\”, 而因为除了mysql(i)_set_charset影响mysql->charset以外, 其他时刻mysql->charset都为默认值, 所以, 结果就是:

复制代码 代码如下:

  $ php -f 5c.php
  string(3) "慭\"
  string(3) "慭\"
  string(3) "慭\"
  string(2) "慭"

  大家现在很清楚了吧?

时间: 2024-09-19 09:03:41

深入理解mysql SET NAMES和mysql(i)_set_charset的区别_Mysql的相关文章

Mysql存储引擎InnoDB和Myisam的六大区别_Mysql

  MyISAM InnoDB   构成上的区别:     每个MyISAM在磁盘上存储成三个文件.第一个文件的名字以表的名字开始,扩展名指出文件类型.   .frm文件存储表定义.   数据文件的扩展名为.MYD (MYData).   索引文件的扩展名是.MYI (MYIndex).     基于磁盘的资源是InnoDB表空间数据文件和它的日志文件,InnoDB 表的大小只受限于操作系统文件的大小,一般为 2GB     事务处理上方面:     MyISAM类型的表强调的是性能,其执行数度

Mysql 的存储引擎,myisam和innodb的区别_Mysql

简单的表达.  MyISAM 是非事务的存储引擎.  innodb是支持事务的存储引擎.    innodb的引擎比较适合于插入和更新操作比较多的应用  而MyISAM 则适合用于频繁查询的应用    MyISAM --表锁.  innodb--设计合理的话是行锁.  MyISAM 不会出现死锁.    最大的区别就是MYISAM适合小数据,小并发:INNODB 适合大数据,大并发.最大的区别就是在锁的级别上.    MyISAM类型不支持事务处理等高级处理,而InnoDB类型支持. MyISA

mysql中order by与group by的区别_Mysql

order by 从英文里理解就是行的排序方式,默认的为升序. order by 后面必须列出排序的字段名,可以是多个字段名.      group by 从英文里理解就是分组.必须有"聚合函数"来配合才能使用,使用时至少需要一个分组标志字段.  什么是"聚合函数"?  像sum().count().avg()等都是"聚合函数"  使用group by 的目的就是要将数据分类汇总.

MySQL插入中文不乱码的5种方法_Mysql

方法一: 登录MySQL,先做 set names latin1 ,然后在更新语句或者执行SQL语句 mysql> set names latin1; mysql> source test.sql; 方法二:在SQL文件中指定set names latin1;然后登录MySQL,执行相应文件 [root@localhost ~]# cat test.sql set names latin1; insert *****************; mysql> source test.sql

MySQL中DATE_FORMATE函数使用时的注意点_Mysql

今天帮同事处理一个SQL(简化过后的)执行报错: mysql> select date_format('2013-11-19','Y-m-d') > timediff('2013-11-19', '2013-11-20'); ERROR 1267 (HY000): Illegal mix of collations (utf8_general_ci,COERCIBLE) and (latin1_swedish_ci,NUMERIC) for operation '>' 乍一看挺莫名其妙的

深入理解MySQL乱码问题及MySQL乱码解决

要了解为什么会出现乱码,我们就先要理解:从客户端发起请求,到MySQL存储数据,再到下次从表取回客户端的过程中,哪些环节会有编码/解码的行为.为了更好的解释这个过程,博主制作了两张流程图,分别对应存入和取出两个阶段. 存入MySQL经历的编码转换过程   上图中有3次编码/解码的过程(红色箭头).三个红色箭头分别对应:客户端编码,MySQL Server解码,Client编码向表编码的转换.其中Terminal可以是一个Bash,一个Web页面又或者是一个APP.本文中我们假定Bash是我们的T

【转载】MySQL -- SET NAMES utf8

     一直以 来只知道 mysql_query("S ET NAMES UTF8");  是设定数据库编码的,但是一直不清楚"SET NAMES UTF8"到底是什么.直到今天才知道 SET NAMES xxx 也是 mysql 语句.       真的感觉到自己的功课还没做到家,现有知识储备比较匮乏.现将所查相关资料记下:  1.SET NAMES 'charset_name'  SET NAMES xxx 用于显式设置客户端之后发送的 SQL 语句使用什么字

MySQL中出现乱码问题的终极解决宝典_Mysql

MySQL出现乱码的原因 要了解为什么会出现乱码,我们就先要理解:从客户端发起请求,到MySQL存储数据,再到下次从表取回客户端的过程中,哪些环节会有编码/解码的行为.为了更好的解释这个过程,博主制作了两张流程图,分别对应存入和取出两个阶段. 存入MySQL经历的编码转换过程 上图中有3次编码/解码的过程(红色箭头).三个红色箭头分别对应:客户端编码,MySQL Server解码,Client编码向表编码的转换.其中Terminal可以是一个Bash,一个web页面又或者是一个APP.本文中我们

mysql中order by与group by的区别

以下是对mysql中order by与group by的区别进行了详细的分析介绍,需要的朋友可以过来参考下   order by 从英文里理解就是行的排序方式,默认的为升序. order by 后面必须列出排序的字段名,可以是多个字段名.      group by 从英文里理解就是分组.必须有"聚合函数"来配合才能使用,使用时至少需要一个分组标志字段.  什么是"聚合函数"?  像sum().count().avg()等都是"聚合函数"  使用