java 与 mysql 中文问题的处理

mysql|问题|中文

问题:用 jdbc 插入、读取数据库种文字串乱码。

首先,mysql 数据库中的东西都是二进制存放的,支持任何数据,当然包括中文。你到命令行下
insert into testtable values ( '中文' );
select * from testtable;
全都显示正常。
但是,虽然存取中文没问题,但排序、匹配的时候有问题。所以如果你的数据库里有中文的话,记得在配置文件中,如 c:winntmy.ini 中的 [mysqld] 里添加一行:
default-character-set=gbk
然后重启 mysql server 。 注意 gbk 要小写,不然 mysqld 启动不了。

其次,数据库没问题,下面看看 java 程序。在程序里很无聊地加一句调试语句:
out.println("中文");
也显示正常,说明整个 java 环境没问题。

所以,当然是联系 java 和 mysql 的部分,mysql jdbc driver 出问题了。
分析一下,java 内部使用 unicode ,而 mysql 缺省使用 iso-8xxx(忘了),所以 jdbc driver 把查询字符串传给 mysql server 时,会做 unicode->iso-8xxx 的转换,从 mysql server 接受结果时,会做 iso-8xxx->unicode 的转换。(在屏幕上显示结果时会 unicode->GBK,不过不关这里的事。)
这就有问题了,我在命令行下插入数据库的中文字符串是 GBK (这是简体中文 windows 的默认),所以 jdbc driver 接受查询结果时,应该做 GBK->unicode 的转换才对。
验证一下,对从数据库中读出的中文字串 s ,
new String( s.getByte("iso-8xxx"), "gbk" )
将 s 先做一个 unicode->iso-8xxx 转换成它存放在数据库中的原始模样。我们知道它是 gbk ,所以手工来 gbk->unicode ,这样 java 程序就显式正常了。
类似,写入数据库的时候,我们期待 jdbc driver 会把 unicode->gbk ,结果却是 unicode->iso-8xxx ,当然是乱码了。

有很多文章,就到此为止,并告诉我们:要解决中文问题,自己手工转码吧。
这实在是不负责任。如果每一个字符串都要手工转码,说明程序设计出了问题。
想一想,写 mysql jdbc driver 的家伙会连转码都不知道?
所以我看看 connector-j-3.0.7 里面的 readme, 找到一个解决方案:
connection = DriverManager.getConnection( "jdbc:mysql://localhost/test?user=root&password=&useUnicode=true&characterEncoding=GBK" );
这是告诉 jdbc driver 强制按指定参数转码

其实还是有问题。如果 mysql server 一定得用 iso-8xxx ,那就只有用上一个办法了。但我记得我的 mysql 是 gbk ,不是都改过 my.ini 了吗? jdbc driver 怎么都不自动探测 mysql server 的字符集呢?
这个时候就看到开放源码的好处了 :-) connector-j-3.0.7 源码中确实有代码读取 mysql server 的信息,包括字符集。从注释中知道,
作者为 unicode 转换到单字节字符集写了自己的转换函数,并号称比 jvm 的快百分之多少多少。所以代码中有一段,判段数据库如果使用的是单字节就调用自己的转换函数。但这段代码后面就忘了把多字节字符集交给 jvm 去转换了,所以变成了缺省的 iso-8xxx 转换。
我的修改方式: commysqljdbcConnecter.java 这个文件的 1969 行,
this.doUnicode = true; // force the issue
将之上移四行到 1964 行,放在下面这一行的前面:
try {
用这份代码重新编出来的 jdbc driver ,你的 java 访问数据库的程序不用做任何修改就可以正确读写中文了,不过要记得 mysql server 要 default-character-set=gbk
我使用它测试了几个小程序,中文都显示正常,而且都没死机、异常。呵呵,自我感觉很好。

时间: 2024-11-17 19:18:30

java 与 mysql 中文问题的处理的相关文章

【技术贴】java插入mysql中文乱码解决|java插入mysql数据库显示问号?

[技术贴]java插入mysql中文乱码解决|java插入mysql数据库显示问号?   在你要连接到mysql 的代码里写上?useUnicode=true&characterEncoding=UTF-8" 比如 "jdbc:mysql://localhost:3306/chenluancl1?useUnicode=true&characterEncoding=UTF-8", "root","密码"

java导入mysql出现中文乱码

问题描述 java导入mysql出现中文乱码 我写了一个小程序把txt中的文字读取并写入mysql,然而无论怎么样都有乱码,我试了很多方法都不行,结果最后解决居然是因为url的问题,崩溃了,求大神们看看 之前是这样 public static final String url = "jdbc:mysql://127.0.0.1/website?useUnicode=true&characterEncoding=UTF-8"; 改成这样竟然就没问题了... public stat

java-求教JAVA应用传入mysql中文乱码

问题描述 求教JAVA应用传入mysql中文乱码 JAVA的应用程序用JDBC连接mysql 类似汉字的查询都成功不了,插入汉字也是???乱码 从数据库返回的汉字正常. 数据库和MyEclipse都是GBK编码 ?useUnicode=true&characterEncoding=UTF-8 这个试过了 没用 查询代码如下 java.sql.Statement stmt = connection.createStatement(); String string="哦"; Res

MySQL中文参考手册3(MySQL邮件列表及如何提问或报告错误)

mysql|参考|参考手册|错误|邮件列表|中文 MySQL中文参考手册3(MySQL邮件列表及如何提问或报告错误)转载 译者:晏子 [返回][转发] 译者:晏子 (clyan@sohu.com)主页:http://linuxdb.yeah.net 2 MySQL邮件列表及如何提问或报告错误2.1  MySQL 邮件列表要订阅主 MySQL 邮件列表,送一条消息到电子邮件地址 mysql-subscribe@lists.mysql.com . 要退订主 MySQL 邮件列表,送一条消息到电子邮件

MySQL中文参考手册(目录)

mysql|参考|参考手册|中文 MySQL中文参考手册(目录)转载 译者:晏子 [返回][转发] 译者:晏子 (clyan@sohu.com)主页:http://linuxdb.yeah.net 0  译者序 1 MySQL的一般的信息1.1 什么是MySQL? 1.2 关于本手册1.2.1 本手册中使用的约定 1.3 MySQL的历史 1.4 MySQL的主要特征 1.5 MySQL稳定性? 1.6 顺应2000年 1.7 SQL一般信息和教程 1.8 有用的MySQL相关链接 2 MySQ

MySQL中文参考手册2(MySQL 的一般信息)

mysql|参考|参考手册|中文 MySQL中文参考手册2(MySQL 的一般信息)转载 翻译:晏子 [返回][转发] 译者:晏子 (clyan@sohu.com)主页:http://linuxdb.yeah.net 1 MySQL 的一般信息这是MySQL参考手册:它记载了MySQL版本3.23.7-alpha. MySQL 是一个快速.多线程.多用户和强壮的SQL数据库服务器. 对Unix和 OS/2 平台,MySQL基本上是免费的:但对微软平台,你在30 天的试用期后必须获得一个MySQL

解决MySQL中文乱码以及版本不一致问题

这几天基于Heritrix写了一个爬虫,用到MySQL,在导入导出数据时,遇到一些乱码问题,好不容易解决了,记录一下,以备查看.  一.导出数据 先说明一下自己的环境:Mac OS X 10.8.3, MySQL Community Server 5.6.10, MySQL Workbench 5.2.47. 我想把本机数据库内的数据迁移到另一台机器上,于是使用Workbench中自带的import/export功能,其实就是调用mysqldump.不幸的是,出现了版本不一致的错误.   错误没

mysql中文乱码问题???

问题描述 mysql中文乱码问题??? Connection id: 3 Current database: hibernatedb Current user: root@localhost SSL: Not in use Using delimiter: ; Server version: 5.6.17 MySQL Community Server (GPL) Protocol version: 10 Connection: localhost via TCP/IP Server charac

Mysql中文乱码以及导出为sql语句和Excel问题解决方法[图文]_Mysql

一.导出数据. 先说明一下自己的环境:Mac OS X 10.8.3, MySQL Community Server 5.6.10, MySQL Workbench 5.2.47. 我想把本机数据库内的数据迁移到另一台机器上,于是使用Workbench中自带的import/export功能,其实就是调用mysqldump.不幸的是,出现了版本不一致的错误. 错误没治了,最终找到解决方案,可以指定mysql的mysqldump,路径为:/usr/local/mysql/bin/mysqldump,