UTF8转成GB2312乱码问题解决方案_XML示例

最近做了一个小项目,遇到此类问题,记录一下,也算是一个总结。
此项目分为两部分,一个是新闻数据采集,一个是采集信息的审核,最后生成XML文件。

数据采集后的数据经过用户编辑完之后,要导出一个ACCESS文件,然后把这个文件导入到信息审核系统。在ACCESS库中存储新闻信息的字段类型是ntext类型,而审核系统库中对应的是varchar(max)类型的字段,导入之后,发现有的空白字符会出现乱码,表现为问号(?),其实经过后面的测试,这不是空白(空格)字符,而一个特殊字符,怎么办?经过几番测试后发现,varchar(max)类型要改成nvarchar(max)类型,这样导入的数据就不会再有此类问题了。

但后面的测试过程中,又会发现对导入后的采集信息更改(通过.net程序编辑功能)后,数据库中此条信息又出现了乱码问题,研究后发现在插入语句中这样写就不会出现此类问题了,如insert into 表名 (news)values(N'"+更新后的值+""),为什么加N?去百度一下就明白了。

到此,心中总算得到安慰,但后面的问题又让人陷入郁闷之中。。。。。。
审核完的信息要生成XML类型的文件,并且XML要采用GB2312编码,因为采集的新闻网站,有很多网站采用的是UTF8编码,这样在转化的过程中又出现乱码(还是那个“空白”特殊字符搞的),怎么办?网上介绍的把UTF8转化成GB2312就可以了,但实际发现,还是解决不了问题,这下弄的一上午为了解决这个问题,最后还是没有办法,正郁闷之时,突然想到通过VS的调试功能来看看这个特殊字符究竟是什么玩意,最后通过把数据库的此字段值读取出来之后,然后转化成字符数组,content.ToCharArray(); 一个一个的看,发现,导致乱码的这个字符是' '注意引号中的空白,这不是一个空格,而是一个在GB2312中无法识别的特殊字符,此时突然想到,能不能把这个字符的值直接用空格替换呢?马上行动,果然,解决了乱码问题。真求郁闷,这一个毛玩意浪费了一半天时间。

注意,必须要用调试出来的这个值(因为这才是真正的导致乱码的那个特殊字符),调试的时候在即使窗体中粘贴。

复制代码 代码如下:

content = content.Replace(" ", " ");

时间: 2024-08-04 14:05:29

UTF8转成GB2312乱码问题解决方案_XML示例的相关文章

UTF-8转换成GB2312的全处理

主题:将UTF-8编码的字符串转化成GB2312的编码,没有对应编码的字符串转化为DEC; 的格式.如 회=>회 语言:PHP,Javascript 内容:浏览器用Javascript中encodeURI函数将字符串(包含非GB2312中字符)编码,GET请求到服务器,页面编码均为GB2312,服务器PHP脚本将请求数据转换成GB2312表示. 基础: 1. 单独使用iconv函数只能转换GB2312字符,外文字符无法转换 2. 没有现成的函数可以用 3. bindec()函数:将二进制格式的&qu

将字符串转换成gb2312或者utf-8编码的参数(js版)_javascript技巧

在很多时候,我们直接在url中传递中文参数时,读到的中文都是乱码,那么我们应该怎么将这些参数转换呢? 下面我们来介绍一下方法 1.我们新建一个 UrlEncode.js 然后将下面的代码拷贝进去 复制代码 代码如下: //JS版的Server.UrlEncode编码函数 String.prototype.UrlEncodeGB2312 = function () { var str = this; str = str.replace(/./g, function (sHex) { window.

asp中读取xml以及Utf-8和Gb2312乱码问题

xml|问题 asp中创建xml对象通常使用:CreateObject("Microsoft.XMLDOM")读取节点:selectSingleNode("nodename")//nodename为节点名.读取属性:attributes.getNamedItem("attribute")//attribute为节点中所具有的属性名.加载xml: load(Server.MapPath("data.xml")) async 属性

GB2312转换成UTF-8与utf_8转换成GB2312

 本文转载:http://www.cnblogs.com/jonhson/archive/2010/08/10/1796536.html /// <summary> /// utf_8转换成GB2312 /// </summary> /// <param name="utfInfo"></param> /// <returns></returns> private string ToGB2312(string ut

用Javascript实现UTF8编码转换成gb2312编码_javascript技巧

复制代码 代码如下: //把编码转换成 gb2312编码  function UrlEncode(str)  {  var i, c, ret="", strSpecial="!\"#$%&'()*+,/:;<=>?@[\]^`{|}~%";  for(i = 0; i < str.length; i++)  {  //alert(str.charCodeAt(i));  c = str.charAt(i);  if(c==&qu

utf-8-跪求各位大神解答!!ubuntu下mysql编码改为utf8之后中文还是乱码

问题描述 跪求各位大神解答!!ubuntu下mysql编码改为utf8之后中文还是乱码 大神们请莫先喷我为何要问这种幼稚问题TAT 情况如下: ubuntu14.04下安装mysql5.5(最简单的安装方法:apt-get install...) 考虑到mysql默认编码为latin,会出现中文乱码,所以按照网上的方法修改了 my.cnf 如下: 之后重启mysql,查看了编码 本以为一切搞定,事与愿违,我试了试插入中文的字段,结果乱码 在workbench中也是这样 apply之前: appl

httpwebresponse-[vb.net]HttpWebResponse的编码问题——GB2312乱码

问题描述 [vb.net]HttpWebResponse的编码问题--GB2312乱码 我想用这段代码登录获取cookie,然后再访问用户页面,这一部分工作正常.可是如果遇到GB2312编码的网页就会出现乱码.请高手指点,万分感谢! 另:选这个网址仅供说明只用,没有别的意思. Imports System.Net Imports System.IO Imports System.Text Public Class Form1 Const ConnectURL = "http://www.guqu

python 中文乱码问题解决方案

      最近在项目中部署结巴分词的时候遇到了乱码情况,明明是中文,确显示不出来或者显示乱码.解决方案如下. 利用isinstance 来判断是否已经编码,s是出问题的字符串.unicode是没编码 isinstance(s, unicode):  用print 打印,如果结果是true说明没编码.如果是false说明编码了,但是编的码不对 print isinstance(s,unicode) 如果没编码,加入编码 s.encode('UTF-8') 如果编码了,编错了,就先解码再编 s.d

在SQL 2005中用T-SQL插入中文数据时出现的问号或乱码的解决方案[转]

在SQL 2005中用T-SQL插入中文数据时出现的问号或乱码的解决方案 病症表现为:主要表现为用T-sql语句插入中文数据时数据库显示全是问号"???" 解决办法: 第一种办法:先选中出错的数据库→选中以后右键点击属性会弹出数据库属性 对话框→选中数据库属性对话框中的选项→把选项中的排序规则设置成:Chinese_PRC_90_CI_AS→最后点击确定即可.(注意:在选择数据库属性的时候必须确保你所修改的数据库未被使用才可以修改否则会失败的) 第二种办法:首先打开你的sql查询分析器