让你不苦恼:Java的中文编程配置心得

编程|心得|中文

  Java的中文编程与配置心得

  Java的中文问题历史悠久,连绵不绝,至今也没有完全解决,但是上有政策下有对策,我们总是有办法搞定它的。跟Java相关的中文问题主要有两类,一类是编程的问题,涉及到I/O,内码转换等。第二类是Java运行环境的配置,涉及字体,属性配置等。我刚刚用了一天的时间解决这些问题,觉得很有必要给自己写个备忘录之类的。

  我看还是从问题入手吧,这样不致于让大家打瞌睡。我想写个程序,这个程序有个基本功能就是显示文件内容,我用JTextArea来做显示的事情,程序简单的到家了,但是就是中文都是乱码。我的配置是JBuilder7,JBuilder自带的JDK1.3.3_b24,我自己装的JDK是JDK1.4.0_02_b02,都是主流的JDK。操作系统是英文Windows2000加中文支持包。

  我尝试换JDK,1.3.3和1.4.0都不行,down一个最新的j2sdk-1_4_1-rc也是不行,好像不是JDK的问题,于是我就把精力集中到I/O的编码转换上,我查阅了网上若干关于JAVA中文问题的文章,把编码转换搞的倍儿清楚,可是怎么试,换什么编码折腾都不行,反而显示的更糟糕,当初还是乱的有些规矩,就是象在纯英文系统上显示的那样,好歹我还知道那是汉字,只是显示不出来,等我折腾编码,就变得都是问号了。唉,郁闷!

  编码转换心得:

  JAVA内部是UNICODE编码,在I/O时如果使用Reader/Writer就要发生编码转换,使用系统属性file.encoding作为编码方式。如果使用Stream就没有转换的事情了,那是Binary的数据。

  有用的方法有:1。在Reader/Writer上加encoding的选项,注意编码的方向,在Reader中的encoding表示把数据从encoding转换成Unicode,writer就是把Unicode的字符转换成encoding格式的。2。用String.getByte()把字符串转换成指定编码。

  常用的编码格式:ISO8859_1,这个是英文系统缺省的8bit编码,因为是8bit的,所以不会把汉字的高位删去,所以用它也是可以处理汉字的(我自己这么理解,总觉得有些不妥,但又不知道不妥在何处,还望高人指出)。GB2312和GBK,汉字编码,推荐使用GBK,它兼容GB2312并且支持更多汉字。UNICODE,一个大的字符集,不知是不是国际标准反正大家都支持,使用16位对每个字符编码,汉字虽然正合适,但英文却吃亏了,要用多一倍的空间来存储,所以很多人还是老大不乐意,写的程序不支持UNICODE。

  JSP/Servlet的中文问题有两种解决办法:1。不在程序中进行编码转换,把这个工作交给浏览器,方法就是用javac –encoding GBK *.java来编译所有的bean,然后在JSP页面上加

<%@ page contentType="text/html;charset=gb2312" %>

  <%@ page contentType="text/html;charset=gb2312" %>

  或者是在HTML中直接加:

  到底加那个,试试就知道了,我也搞不清楚了。

  2。在程序中指定编码,用javac –encoding ISO8859_1 *.java来编译所有的bean,在涉及到中文显示的程序上加

  str=new String(str.getBytes("ISO8859_1"));

  上面两种方法不能混用,意思就是要么就是GBK,要么就是ISO8859_1,从里到外都一样就好了。

  数据库JDBC的中文问题,一般只要按照数据库指定的编码进行转换,比如按照ISO8859_1读,ISO8859_1写,一般就没什么问题了。

  虽然有这些编码上的心得,但是并不能解决我的问题。看来我的程序输入输出用的都是ISO8859_1,我的问题跟编码没什么关系。是不是字体的问题呢?在Swing的组件中,字体总是那么几个,基本上是定死的,选那个都不行。但是我突然发现可以更改这些字体的配置,就是font.properties 这个文件,一般JDK都带了中文的字体配置文件,可能是font.properties.zh之类的,不同版本的JDK名字有些差别,你要做的就是用中文的配置覆盖font.properties文件。我满心欢喜的以为成功了,但是失败无情的又一次打击了我。不是这种方法不对,但是在Windows系统中,java能够比较自动的检查你的系统编码,使用最合适的字体配置文件,一般不需要你改动了,在JDK1.2之前确实是要这么改的,难怪那篇文章是JDK1.1的文档呢。

  连font.properties也不灵了,唉,是不是JBuilder有问题呀?到了这儿,我不得不怀疑它了,虽然它从没让我失望过,我关掉JBuilder,拿起JDK命令行,哎呀!可爱的中文竟然出来了!简直是.....莫名其妙呀,因为JBuilder也是用的这个JDK呀?没理由呀,我再次打开JBuilder,运行,乱码!怪事.......我来看看.....我把JBuilder里面的执行命令拷贝到DOS窗口里手动执行....没有中文.....怪怪怪,我仔细对照我手敲的命令和JBuilder拷出来的命令,除了我用的是java它用的是javaw之外,别的几乎都一样,难道.......这个java和javaw竟然会不一样?

  唉.......要我说什么呢,答案就是这个了,javaw会使用与java不同的Local配置进行工作,导致了我一直看不到中文,而java就是好好的。JBuilder也是好好的,没有问题,调用javaw也不是它的错,难道你想每次运行或者调试的时候蹦出个DOS黑框么?呵呵。这是JDK的一个Bug,我在java的网站上查到这个bug,描述的情况跟我的一样,然后Sun说这个Bug已经修复了,嘿嘿,简直就是扯淡!修复个茄子!Bug编号是:4629351。不信可以去看看。

  但是难道我就不能在JBuilder里面看我可爱的中文了吗?好像JBuilder5的时候还能选择是用java还是javaw,现在好像没法儿选了。怎么才能让javaw支持中文呢?经过又是一番苦苦查找,竟然没有什么结果,郁闷!正当苦闷之时,突然想起当初配置过UNIX下的TOMCAT,好像加了些启动参数,就能让tomcat支持中文了,赶快翻出以前的文档,啊,幸好我当初写了工作心得,要不然又抓瞎了。其实道理很简单,就是给JAVA虚拟机加上一些属性:

-Dfile.encoding=GBK -Ddefault.client.encoding=GBK -Duser.language=zh -Duser.region=CN

  把它跟在javaw的命令行后面当参数,哈哈,搞定!

  在JBuilder中选择Project->Project Properties->run->edit->VM Parameters,填上就行了!

  配置心得:

  在JDK低版本和UNIX下,需要改动font.properties,让JAVA VM能够找到合适的字体来显示汉字。

  目前为止,javaw有Bug,只使用英文的Local,需要给VM加上属性才行正常显示中文。

时间: 2024-08-30 06:26:29

让你不苦恼:Java的中文编程配置心得的相关文章

Java的中文编程与配置心得

Java的中文问题历史悠久,连绵不绝,至今也没有完全解决,但是上有政策下有对策,我们总是有办法搞定它的.跟Java相关的中文问题主要有两类,一类是编程的问题,涉及到I/O,内码转换等.第二类是Java运行环境的配置,涉及字体,属性配置等.我刚刚用了一天的时间解决这些问题,觉得很有必要给自己写个备忘录之类的.我看还是从问题入手吧,这样不致于让大家打瞌睡.我想写个程序,这个程序有个基本功能就是显示文件内容,我用JTextArea来做显示的事情,程序简单的到家了,但是就是中文都是乱码.我的配置是JBu

C++ POCO库中文编程参考指南(11) 如何使用Reactor框架?

1 Reactor 框架概述 POCO 中的 Reactor 框架是基于 Reactor 设计模式进行设计的.其中由 Handler 将某 Socket 产生的事件,发送到指定的对象的方法上,作为回调. 2 光说不练假把式 PoechantReactorServer 类,基本与 PoechantTCPServer: class PoechantReactorServer: public ServerApplication { public: PoechantServer() {} //: _he

POCO库中文编程参考指南(1)总览

POCO库中文编程参考指南(1)总览 作者:柳大·Poechant 博客:Blog.CSDN.net/Poechant 邮箱:zhongchao.ustc#gmail.com (# -> @) 日期:April 14th, 2012 1 What is POCO? POCO 是什么?这是我最常被人问到的.POCO 是 POrtable COmponents 的缩写,官方主页:POCOProject.org.是一个非常出色的 C++ 库,相当于 Java 的 Class Library..NET

如何迅速成为Java高手_JSP编程

    很多网友问我学习Java有没有什么捷径,我说"无他,唯手熟尔".但是我却很愿意将自己学习的一些经验写出来,以便后来者少走弯路,帮助别人是最大的快乐嘛! 要想学好Java,首先要知道Java的大致分类.我们知道,自从Sun推出Java以来,就力图使之无所不包,所以Java发展到现在,按应用来分主要分为三大块:J2SE,J2ME和J2EE,这也就是Sun ONE(Open Net Environment)体系.J2SE就是Java2的标准版,主要用于桌面应用软件的编程:J2ME主要

你见过中文编程的代码吗?台湾人这段中文代码真是逆天了!

最近几天,各大网站都在发布热门编程语言排行版.点进去一看,最热门的语言是JAVA,位列第二第三的分别是C语言和C++,第四第五是C#和python.为什么热门的编程语言都是英语,而没有中文编程语言.也许很多人会说这个问题没有营养,但是关于这个问题的谈论,却始终没有消停. 热门语言排行版 W3Cschool小师妹在某个贴吧上看到一个很有意思的话题,那就是"我们离汉语编程有多远". 贴吧截图 吧主称文字很有魅力,可以穿越空间.时间,带给大家新的认识.21世纪,如果你不会编程,那么你就是文盲

编译-一个java新手在编程路上遇到的问题

问题描述 一个java新手在编程路上遇到的问题 路过的大牛瞄一眼,谢谢...大一学生一枚,java学到网络编译了,最近在实现ftp服务器,目前还没写出来,心情十分郁闷,我觉得自己要成为编程员的随机应变能力还不够,编程路上的困惑,曾经也遇过类似状况求个回复. 解决方案 没什么,大一的时候让我自己去实现一个ftp服务器,我也觉得挺困难的.所以你要上大学啊. 解决方案二: 困惑:坚持.不会:学习.前排 解决方案三: 任何知识都有一个主干,首先要了解基本的原理,然后再学习细节.如果你是自学,一定要注意这

Java网络服务器编程(NIO版)

编程|服务器|网络 从Java 1.4开始提供的NIO API常用于开发高性能网络服务器,本文演示了如何用这个API开发一个TCP Echo Server.   Java网络服务器编程 一文演示了如何使用Java的Socket API编写一个简单的TCP Echo Server.其阻塞式IO的处理方式虽然简单,但每个客户端都需要一个单独的Thread来处理,当服务器需要同时处理大量客户端时,这种做法不再可行.使用NIO API可以让一个或有限的几个Thread同时处理连接到服务器上的所有客户端.

客户端Cookie中文编程(上)

cookie|编程|客户端|中文 客户端Cookie中文编程(转自yesky.com) Cookie的使用中,我们发现这样一个问题:如果写入Cookie的内容是中文(如用户称呼),用服务器端程序(如ASP或PHP)读出完全正确,但是用一般的JavaScript或VBScript的读Cookie函数取出的却是一堆乱码.这是一个棘手的问题,因为在有些情况下,Cookie的内容需要在客户机端用脚本语言读取.如果你写入了中文,得到了一堆乱码,是不是感觉很别扭呢?解决这个问题,还要从Cookie的存取方式

C++ POCO库中文编程参考指南(8) 丰富的Socket编程

1 POCO 中的 Socket POCO 中有 丰富的 Socket 封装.其继承关系如下: 本文暂且只介绍 StreamSocket.ServerSocket.DatagramSocket 2 Poco::Net::ServerSocket ServerSocket 是一个封装层次比较低(low level)的 Socket,其使用的是 TCP 连接.在实际的 Server 中推荐使用 TCPServer 或 Reactor 框架.下面是例程: #include "Poco/Net/Serv