谈汉字转换类型及解决方案

●简繁转换有四种情况
  汉字转换,分为内码转换和简繁转换。
  内码转换属于简繁转换,但是他主要是在GB码和BIG5码之间转换。
  另外一种简繁转换是在GB码内部的转换。GB码扩展集包含两万多个汉字,自然也存在简繁转化问题。例如,大陆网友从BIG5码繁体字网页用“复制--粘贴”的方法虽然得到的是繁体字文件,但他已经不是BIG5码的字体了。尽管页面的内码是BIG5码,但是经过复制--粘贴,已经变成了GB内码的繁体字,粘贴到“笔记本”时不是乱码,要知道,大陆简体windows系统的笔记本,是不能识别BIG5码的。若要把这繁体字变为简体字,用一般的方法可就不行了。
  所以,不要以为繁体字就都是BIG5码。因此,汉字转换分为四种情况:
  1。GB转BIG5
  2。BIG5转GB
  3。简体字转繁体字(在GBK大陆内码中转换)
  4。繁体字转简体字(同上)
●网页“另存为”的转换特点。利用网页“另存为”转换汉字内码。
  当我们把某个BIG5的网页用“另存为”的方式保存时,你注意看,“保存WEB页”窗口最下方有个“编码”栏,里面至少有三种选择:Unicode(UTF-8),繁体中文(BIG5),简体中文(GB2312)。
本网页的内码是Unicode(UTF-8),所以能够同时显示GB码和 BIG5码汉字。你选择不同的内码保存,就已经进行了内码转换。利用这个特点,我们可以用网页“另存为”转换汉字内码。
●网上在线汉字转换,大多是内码转换。若想把复制下来的GB码繁体字转换为同内码的简体字,或者相反,网上的转换功能显然不足。
●《金山快译》包含两个文件:KConvert.exe和Cjktab32.dll,总共大小才484K,压缩成RAR文件後仅仅235K。可以直接提取出来单独使用。他可以进行上述四种汉字的任意转换。
  我已将金山快译的这两个文件上传,要用的网友可以下载。
金山快译的内码转换(解压可用,无须安装)
■http://202.202.4.200/upload/upfile/gb-big5.rar■
●手工修改个别字
  不过,绝大多数汉字转换软件有个小问题,简体到繁体自动转换时,个别字转换有毛病(一对多的毛病),姓范的范,会转换成模

时间: 2024-09-20 05:51:55

谈汉字转换类型及解决方案的相关文章

javascript将汉字转换成二进制

问题描述 javascript将汉字转换成二进制 解决方案 function getCharBinary(str) {var i = 0;var result = "";while (true) {var temp = str.charCodeAt(i++);if (temp) {result += temp.toString(2);} else{break;}}return result;}

nhibernate-NHibernate 保存实体类时无法转换类型

问题描述 NHibernate 保存实体类时无法转换类型 求NHibernate会的请教!实体类:Userinfo 和 Userinfo.hbm.xml是用codesmith生成的.userinfo属性如下: protected Guid _id; protected string _userName; protected string _password; protected string _email; protected int _state = 0 ; protected string

dao-怎么在action中接收jsp页面传来的字符串类型的数据,是需要转换类型还是和int类型一样

问题描述 怎么在action中接收jsp页面传来的字符串类型的数据,是需要转换类型还是和int类型一样 怎么在action中接收jsp页面传来的字符串类型的数据,是需要转换类型还是和int类型一样?要是需要转换 actiong里应该怎么写?相对应的dao和 findall里怎么写?跪求大神赐教,指导 解决方案 将int类型大于255的数值转换为十六进制字符串 解决方案二: 楼主用的struts吗?直接aciton?xxx1=xxx2. 多个用&符号. 后台直接对应xxx1的名字就行了!要提供属性

asp.net 汉字转换拼音及首字母实现代码_实用技巧

Default.aspx页面 复制代码 代码如下: <%@ Page Language="C#" AutoEventWireup="true" CodeFile="Default.aspx.cs" Inherits="_Default" %> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http:

急,急,急~!!如何在C#中将汉字转换成2进制代码并将2进制代码存放在一个数组里面

问题描述 我有个设计需要将文本中的汉字转换成2进制代码然后存放在一个BYTE型的数组里面,希望各位大大帮我解决下. 解决方案 解决方案二:strings="汉字";byte[]b=System.Text.Encoding.Default.GetBytes(s);解决方案三:下面是转化成字符串形式的16位二进制publicstaticstringChar2Binary(stringstr){stringstrCode="";byte[]byteArray=null;f

javascript学习笔记_浅谈基础语法,类型,变量_基础知识

基础语法.类型.变量 非数字值的判断方法:(因为Infinity和NaN他们不等于任何值,包括自身) 1.用x != x ,当x为NaN时才返回true; 2.用isNaN(x) ,当x为NaN或非数字值时,返回true; 3.用isFinity(x),在x不是NaN.Infinity.-Infinity时返回true; 虽然(字符串.数字.布尔值)不是对象,他们的属性是只读的,但也可以像操作对象一样来引用他们的属性和方法,原理: javascript构造一个(String.Number.Boo

Java技术 汉字转换成拼音简码 和 汉字转换成五笔简码

问题描述 Java技术汉字转换成拼音简码和汉字转换成五笔简码例如输入:侃侃拼音简码:KK五笔码:WW有写好的类最好 解决方案 解决方案二:拼音的话网上有写好的包,五笔还是算了,没发现过解决方案三:这样都可以啊??学习中解决方案四:有些繁体拼音也不可以显示

asp.net汉字转换拼音之首字母转换

index.aspx的首页 这个页面主要是用来给用户提交数据的.  代码如下 复制代码 <%@ Page Language="C#" AutoEventWireup="true" CodeFile="Default.aspx.cs" Inherits="_Default" %> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN

ASP写的汉字转换UTF-8及UTF-8转GB2312

汉字|转换 汉字转换为UTF-8 function chinese2unicode(Str)   dim i   dim Str_one   dim Str_unicode   for i=1 to len(Str)     Str_one=Mid(Str,i,1)     Str_unicode=Str_unicode&chr(38)     Str_unicode=Str_unicode&chr(35)     Str_unicode=Str_unicode&chr(120)