中文转换成Unicode编码和Unicode编码转换成中文,Java代码实现

 

import java.util.Properties;
public class Test {
	public static void main(String[] args) {
		String s = "简介";
		String tt = gbEncoding(s);  //       String tt1 = "你好,我想给你说一个事情";
		System.out.println(decodeUnicode("\\u7b80\\u4ecb"));  //       System.out.println(decodeUnicode(tt1));
		System.out.println(HTMLDecoder.decode("中国"));
		String s1 = "\u7b80\u4ecb";
		System.out.println(s.indexOf("\\"));
		}
	public static String gbEncoding(final String gbString) {
		char[] utfBytes = gbString.toCharArray();
		String unicodeBytes = "";
		for (int byteIndex = 0; byteIndex < utfBytes.length; byteIndex++) {
			String hexB = Integer.toHexString(utfBytes[byteIndex]);
			if (hexB.length() <= 2) {
				hexB = "00" + hexB;
				}
			unicodeBytes = unicodeBytes + "\\u" + hexB;
			}
		System.out.println("unicodeBytes is: " + unicodeBytes);
		return unicodeBytes;            }
	public static String decodeUnicode(final String dataStr) {
		int start = 0;
		int end = 0;
		final StringBuffer buffer = new StringBuffer();
		while (start > -1) {
			end = dataStr.indexOf("\\u", start + 2);
			String charStr = "";
			if (end == -1) {
				charStr = dataStr.substring(start + 2, dataStr.length());
				} else {
					charStr = dataStr.substring(start + 2, end);
					}
			char letter = (char) Integer.parseInt(charStr, 16); // 16进制parse整形字符串。
			buffer.append(new Character(letter).toString());
			start = end;
			}
		return buffer.toString();
		}        }
	}
	}
}
时间: 2024-08-04 12:42:03

中文转换成Unicode编码和Unicode编码转换成中文,Java代码实现的相关文章

请帮忙把字节码翻译成java代码

问题描述 请帮忙把字节码翻译成java代码 有人能帮忙把下面的字节码翻译成对应的java代码吗,谢谢 // Byte code: // 0: ldc 40 // 2: dup // 3: astore_2 // 4: monitorenter // 5: aconst_null // 6: astore_3 // 7: aconst_null // 8: astore 4 // 10: aconst_null // 11: astore 5 // 13: aload_1 // 14: invok

字符编码知识:Unicode、UTF-8、ASCII、GB2312等编码之间是如何转换的?

转自:  http://apps.hi.baidu.com/share/detail/17798660 字符编码是计算机技术的基石,想要熟练使用计算机,就必须懂得字符编码的知识.不注意的人可能对这个不在意,但这些名词有时候实在让人迷惑,对想学习计算机知识的人来说,搞懂它也十分重要,我也是在学习中慢慢了解了一些这方面的知识. 1. ASCII码      在计算机内部,所有的信息最终都表示为一个二进制的字符串.每一个二进制位(bit)有0和1两种状态,因此八个二进制位就可以组合出256种状态,这被

用php实现gb2312和unicode(UTF-8)间的编码转换

下面的例子是将 gb2312 转换为 uft-8 这种形式php4.3.1以后的iconv函数很好用的,只是需要自己写一个uft8到unicode的转换函数查表(gb2312.txt)也行 <?$text = "电子书库";preg_match_all("/[\x80-\xff]?./",$text,$ar);foreach($ar[0] as $v)  echo "".utf8_unicode(iconv("GB2312&quo

lua中编码转换 utf16转utf8,unicode转utf8

问题描述 lua中编码转换 utf16转utf8,unicode转utf8 lua中怎么从utf16转到utf8 ? 从网上找到个js的实现方法,但是不知道参数是什么, function utf16ToUtf8(s){ if(!s){ return; } var i, code, ret = [], len = s.length; for(i = 0; i < len; i++){ code = s.charCodeAt(i); if(code > 0x0 && code &l

php处理微信Emoji表情Unicode字符转码编码的问题解决

什么是Emoji?我们来看看百度百科的解释 emoji就是表情符号,来自日语词汇"?文字"(假名为"えもじ",读音即emoji). emoji的创造者日本人是栗田?崇(Shigetaka Kurita),他将目光投向儿时的各种元素以获取灵感,如日本漫画和日本汉字等."日本漫画中有许多不同的符号.漫画家会画出一些表情,表现一个人满头大汗或是迸发出一个想法时头上出现一个灯泡.同时,从日本汉字中他获得了一种能力,用简单的字符来表达"秘密"和&

unicode ansi utf-8 unicode_big_endian编码的区别

随便说说字符集和编码  快下班时,爱问问题的小朋友Nico又问了一个问题:  "sqlserver里面有char和nchar,那个n据说是指unicode的数据,这个是什么意思."  并不是所有简单的问题都很容易回答,就像这个问题一样.于是我答应专门写一篇BLOG来从头讲讲编码的故事.那么就让我们找个草堆坐下,先抽口烟,看看夜晚天空上的银河,然后想一想要从哪里开始讲起.嗯,也许这样开始比较好--  很久很久以前,有一群人,他们决定用8个可以开合的晶体管来组合成不同的状态,以表示世界上的

ANSI,Unicode,UTF-8网页编码的区别

1.ASCII码 我们知道,在计算机内部,所有的信息最终都表示为一个二进制的字符串.每一个二进制位(bit)有0和1两种状态,因此八个二进制位就可以组合出256种状态,这被称为一个字节(byte).也就是说,一个字节一共可以用来表示256种不同的状态,每一个状态对应一个符号,就是256个符号,从0000000到11111111. 上个世纪60年代,美国制定了一套字符编码,对英语字符与二进制位之间的关系,做了统一规定.这被称为ASCII码,一直沿用至今. ASCII码一共规定了128个字符的编码,

带你玩转Visual Studio——带你理解多字节编码与Unicode码

目录(?)[-] 多字节字符与宽字节字符 char与wchar_t string与wstring string 与 wstring的相关转换 字符集Charcater Set与字符编码Encoding 工程里多字节与宽字符的配制 Unicode Character Set与Multi-Byte Character Set有什么区别呢 理解_T_Text宏即L DwordLPSTRLPWSTRLPCSTRLPCWSTRLPTSTRLPCTSTR 理解CString产生的原因与工作的机理   上一篇

学点Unicode又不会死——Unicode的流言终结者和编码大揭秘

如果你是一个生活在2003年的程序员,却不了解字符.字符集.编码和Unicode这些基础知识.那你可要小心了,要是被我抓到你,我会让你在潜水艇里剥六个月洋葱来惩罚你. 这个邪恶的恐吓是Joel Spolsky在十年前首次发出的.不幸的是,很多人认为他只是在开玩笑,因此,现在仍有许多人不能完全理解Unicode,以及Unicode.UTF-8.UTF-16之间的区别.这就是我写这篇文章的原因. 言归正传,设想在一个晴朗的下午,你收到一封电子邮件,它来自一个你高中之后就失去联系的朋友,并带有一个tx

js把字符串编码转换为Unicode编码

Javascript 内置了转换函数:String.fromCharCodeAt().string.charCodeAt()来进行字符串与编码之间的转换. 所以我们要进行字符串的转换其实很简单,直接用 string.charCodeAt() 函数可以获取到该字符串的 Unicode 编码,这里得到的数字是十进制的,我们加以 number.toString() 方法,即可活动该字符串的16进制的 Unicode 编码. 通过拼装,我们既可以得到标准的 unicode 形式的字符串,详见以下方法: