java转换字符串的编码(转)

package com.Alex.base;

import java.io.UnsupportedEncodingException;

    /**
     * 转换字符串的编码
     */
    public class ChangeCharset {
     /** 7位ASCII字符,也叫作ISO646-US、Unicode字符集的基本拉丁块 */
     public static final String US_ASCII = "US-ASCII";

     /** ISO 拉丁字母表 No.1,也叫作 ISO-LATIN-1 */
     public static final String ISO_8859_1 = "ISO-8859-1";

     /** 8 位 UCS 转换格式 */
     public static final String UTF_8 = "UTF-8";

     /** 16 位 UCS 转换格式,Big Endian(最低地址存放高位字节)字节顺序 */
     public static final String UTF_16BE = "UTF-16BE";

     /** 16 位 UCS 转换格式,Little-endian(最高地址存放低位字节)字节顺序 */
     public static final String UTF_16LE = "UTF-16LE";

     /** 16 位 UCS 转换格式,字节顺序由可选的字节顺序标记来标识 */
     public static final String UTF_16 = "UTF-16";

     /** 中文超大字符集 */
     public static final String GBK = "GBK";

     /**
      * 将字符编码转换成US-ASCII码
      */
     public String toASCII(String str) throws UnsupportedEncodingException{
      return this.changeCharset(str, US_ASCII);
     }
     /**
      * 将字符编码转换成ISO-8859-1码
      */
     public String toISO_8859_1(String str) throws UnsupportedEncodingException{
      return this.changeCharset(str, ISO_8859_1);
     }
     /**
      * 将字符编码转换成UTF-8码
      */
     public String toUTF_8(String str) throws UnsupportedEncodingException{
      return this.changeCharset(str, UTF_8);
     }
     /**
      * 将字符编码转换成UTF-16BE码
      */
     public String toUTF_16BE(String str) throws UnsupportedEncodingException{
      return this.changeCharset(str, UTF_16BE);
     }
     /**
      * 将字符编码转换成UTF-16LE码
      */
     public String toUTF_16LE(String str) throws UnsupportedEncodingException{
      return this.changeCharset(str, UTF_16LE);
     }
     /**
      * 将字符编码转换成UTF-16码
      */
     public String toUTF_16(String str) throws UnsupportedEncodingException{
      return this.changeCharset(str, UTF_16);
     }
     /**
      * 将字符编码转换成GBK码
      */
     public String toGBK(String str) throws UnsupportedEncodingException{
      return this.changeCharset(str, GBK);
     }

     /**
      * 字符串编码转换的实现方法
      * @param str  待转换编码的字符串
      * @param newCharset 目标编码
      * @return
      * @throws UnsupportedEncodingException
      */
     public String changeCharset(String str, String newCharset)
       throws UnsupportedEncodingException {
      if (str != null) {
       //用默认字符编码解码字符串。
       byte[] bs = str.getBytes();
       //用新的字符编码生成字符串
       return new String(bs, newCharset);
      }
      return null;
     }
     /**
      * 字符串编码转换的实现方法
      * @param str  待转换编码的字符串
      * @param oldCharset 原编码
      * @param newCharset 目标编码
      * @return
      * @throws UnsupportedEncodingException
      */
     public String changeCharset(String str, String oldCharset, String newCharset)
       throws UnsupportedEncodingException {
      if (str != null) {
       //用旧的字符编码解码字符串。解码可能会出现异常。
       byte[] bs = str.getBytes(oldCharset);
       //用新的字符编码生成字符串
       return new String(bs, newCharset);
      }
      return null;
     }

    public static void main(String[] args) throws UnsupportedEncodingException {
          ChangeCharset test = new ChangeCharset();
          String str = "This is a 中文的 String!";
          System.out.println("str: " + str);
          String gbk = test.toGBK(str);
          System.out.println("转换成GBK码: " + gbk);
          System.out.println();
          String ascii = test.toASCII(str);
          System.out.println("转换成US-ASCII码: " + ascii);
          gbk = test.changeCharset(ascii,ChangeCharset.US_ASCII, ChangeCharset.GBK);
          System.out.println("再把ASCII码的字符串转换成GBK码: " + gbk);
          System.out.println();
          String iso88591 = test.toISO_8859_1(str);
          System.out.println("转换成ISO-8859-1码: " + iso88591);
          gbk = test.changeCharset(iso88591,ChangeCharset.ISO_8859_1, ChangeCharset.GBK);
          System.out.println("再把ISO-8859-1码的字符串转换成GBK码: " + gbk);
          System.out.println();
          String utf8 = test.toUTF_8(str);
          System.out.println("转换成UTF-8码: " + utf8);
          gbk = test.changeCharset(utf8,ChangeCharset.UTF_8, ChangeCharset.GBK);
          System.out.println("再把UTF-8码的字符串转换成GBK码: " + gbk);
          System.out.println();
          String utf16be = test.toUTF_16BE(str);
          System.out.println("转换成UTF-16BE码:" + utf16be);
          gbk = test.changeCharset(utf16be,ChangeCharset.UTF_16BE, ChangeCharset.GBK);
          System.out.println("再把UTF-16BE码的字符串转换成GBK码: " + gbk);
          System.out.println();
          String utf16le = test.toUTF_16LE(str);
          System.out.println("转换成UTF-16LE码:" + utf16le);
          gbk = test.changeCharset(utf16le,ChangeCharset.UTF_16LE, ChangeCharset.GBK);
          System.out.println("再把UTF-16LE码的字符串转换成GBK码: " + gbk);
          System.out.println();
          String utf16 = test.toUTF_16(str);
          System.out.println("转换成UTF-16码:" + utf16);
          gbk = test.changeCharset(utf16,ChangeCharset.UTF_16LE, ChangeCharset.GBK);
          System.out.println("再把UTF-16码的字符串转换成GBK码: " + gbk);
          String s = new String("中文".getBytes("UTF-8"),"UTF-8");
          System.out.println(s);
         }
        }

http://blog.csdn.net/chow__zh/article/details/8943355

时间: 2024-11-16 18:50:47

java转换字符串的编码(转)的相关文章

《Java安全编码标准》一2.13 IDS12-J在不同的字符编码中无损转换字符串数据

2.13 IDS12-J在不同的字符编码中无损转换字符串数据 在String对象之间进行转换时,如果涉及不同的编码类型,可能会导致数据丢失. 根据Java API[API 2006] 对?String.getBytes(Charset)方法的描述: 该方法总会替代那些错误格式的输入和不可映射的字符序列,把它们替换成这些字符的字节数组. 当必须将一个String转化为字节数组时,例如写入一个文件,并且在这个字符串中含有不可映射的字符序列的时候,就必须进行正确的字符编码. 2.13.1 不符合规则的

使用Java将中文字符转换成Unicode编码

  这两天操作XML使用到了Jdom,在创建XML文件并输出到硬盘的时候遇到一个中文编码的问题:Jdom默认输出的XML编码是UTF-8,但是文档中如果出现中文字符那么该中文字符就会变成乱码,造成XML文件无法被正确解析. UTF-8应该是可以用来表示中文的吧?我不知道这是不是Jdom的一个BUG(Jdom 1.0,beta了10次的产物哦!).我google了一下,大家解决这个问题的办法无非是把Jdom的输出字符集改为GBK或者GB2312,但是这样就会有一些副作用,如果在没有特定字符集(GB

PHP实现自动识别原编码并对字符串进行编码转换的方法_php技巧

本文实例讲述了PHP实现自动识别原编码并对字符串进行编码转换的方法.分享给大家供大家参考,具体如下: /** * 对数据进行编码转换 * @param array/string $data 数组 * @param string $output 转换后的编码 * Created on 2016-7-13 */ function array_iconv($data, $output = 'utf-8') { $encode_arr = array('UTF-8','ASCII','GBK','GB2

浅析PHP中的字符串编码转换(自动识别原编码)

本篇文章是对PHP中字符串编码转换的实现代码进行了详细的分析介绍,需要的朋友参考下   复制代码 代码如下: /**  * 对数据进行编码转换  * @param array/string $data       数组  * @param string $output    转换后的编码  */ function array_iconv($data,$output = 'utf-8') {  $encode_arr = array('UTF-8','ASCII','GBK','GB2312','

JavaScript将字符串转换成字符编码列表的方法

 这篇文章主要介绍了JavaScript将字符串转换成字符编码列表的方法,实例分析了javascript中charCodeAt函数的使用技巧,具有一定参考借鉴价值,需要的朋友可以参考下     本文实例讲述了JavaScript将字符串转换成字符编码列表的方法.分享给大家供大家参考.具体如下: JavaScript将字符串转换成字符编码列表,例如foo转换成 [112,111,111] 方法 1: JavaScript 1.6 ? 1 2 Array.map('foo', function(x)

java中字符串转换问题

问题描述 java中字符串转换问题 比如我要将获得的值"pixiedust.ogg"转换成 "Pixie Dust"要怎么转换? 解决方案 String s = new String("abcd pixiedust.ogg 1234"); s = s.replace("pixiedust.ogg","Pixie Dust"); 解决方案二: String str="pixiedust.ogg&qu

用Java将字符串的首字母转换大小写_java

话不多说,直接上代码 //首字母转小写 public static String toLowerCaseFirstOne(String s){ if(Character.isLowerCase(s.charAt(0))) return s; else return (new StringBuilder()).append(Character.toLowerCase(s.charAt(0))).append(s.substring(1)).toString(); } //首字母转大写 public

java获取字符串编码函数

encoding.java package org.loon.test.encoding; /** *//**  * <p>  * title: loonframework  * </p>  * <p>  * description:编码基本类型集合  * </p>  * <p>  * copyright: copyright (c) 2008  * </p>  * <p>  * company: loonframewor

浅析PHP中的字符串编码转换(自动识别原编码)_php技巧

复制代码 代码如下: /** * 对数据进行编码转换 * @param array/string $data       数组 * @param string $output    转换后的编码 */function array_iconv($data,$output = 'utf-8') { $encode_arr = array('UTF-8','ASCII','GBK','GB2312','BIG5','JIS','eucjp-win','sjis-win','EUC-JP'); $enc