中文与韩、日文混排出现在Gb2312编码的Aspx的处理方法

编码|中文

/*FROM:http://blog.joycode.com/hopeq/archive/2005/09/26/64146.aspx*/
有一个Web项目，Web.Config中requestEncoding和responseEncoding都是gb2312，而从数据库中取出的简介数据可能是中文和韩、日文混合的内容，这时候如果直接输出到页面上，其页面会出现乱码，其中的韩文内容无法正确显示。当然如果项目的编码都使用Utf-8的话将没有这个问题，但这个项目是一个老项目，为了尽量不要影响已有的程序，所以无法将编码改为Utf-8,只能在本页面上动脑筋。

经过研究，发现这个问题可以通过Html实体的方法解决。

对于Html实体请参考：

Character entity references in HTML 4

HTML Document Representation

测试代码：

Byte[] bComments = Encoding.UTF8.GetBytes("一ンブル????中文");
   char[] cComments = Encoding.UTF8.GetChars(bComments);

   StringBuilder charBuilder = new StringBuilder();
   foreach(char c in cComments)
   {
    if(c > '\u0800')
    {
     charBuilder.Append("");
     charBuilder.Append((int)c);
    }
    else
    {
     charBuilder.Append(c);
    }
   }
   Response.Write(charBuilder.ToString());

这段代码的作用是将所有的中文、韩文、日文字符通过硬编码输出成为html实体。而Html实体是不受ResponseEncoding和页面编码集影响的。

说明：

\u0800 以上的为中、韩、日字符。

中文的范围：\u4e00 - \u9fa5，日文在\u0800 - \u4e00，韩文为\u9fa5以上。

这个方法仅仅是为了解决小范围问题，如果各位有更好的办法请指教。

时间： 2024-11-02 02:50:56

中文与韩、日文混排出现在Gb2312编码的Aspx的处理方法

中文与韩、日文混排出现在Gb2312编码的Aspx的处理方法的相关文章

PHP实例：PHP取GB2312编码字符串首字母的方法

PHP中GBK和UTF8编码处理（中文，韩文）

asp开发的网站(中文系统),在日文系统下显示ascx部分都是乱码

ASP中Utf-8与Gb2312编码转换乱码问题的解决方法页面编码声明_应用技巧

网站从GB2312编码到UTF-8编码

js下用gb2312编码解码实现方法_javascript技巧

Ajax 中XmlHttp 乱码的解决方法 (UTF8,GB2312 编码解码)

windows phone 7,sliverlight 下载网页的解析,关于wp7 gb2312编码

xmlhttp 乱码比较完整的解决方法 (UTF8,GB2312 编码解码)_AJAX相关