c#读取的网页中文总是乱码

问题描述

做了一个小程序循环读取baidu的搜索结果,有一个非常奇怪的问题,有几个关键词,居然无论怎么设置,用request读取的网页内容中都包括很多乱码,不知道是我程序的问题还是baidu的设置,有高手可以帮我试下嘛,用request方法直接读取这个网址就可以http://www.baidu.com/s?q1=002179&q2=&q3=&q4=&rn=100&lm=1&ct=0&ft=&q5&q6=&tn=baiduadv

解决方案

本帖最后由 shi02fg 于 2012-04-23 01:10:13 编辑
解决方案二:
utf-8
解决方案三:
控件,,用htmltopdf
解决方案四:
<metahttp-equiv="content-type"content="text/html;charset=utf-8">
解决方案五:
百度、新浪这些网站用的编码方式都是gb2312的,不是utf-8的
解决方案六:
网页的中文一般情况下要么是gb2312要么是utf-8如果gb2312出现乱码请写成utf-8反过来也是。。。。
解决方案七:
引用楼主的回复:

做了一个小程序循环读取baidu的搜索结果,有一个非常奇怪的问题,有几个关键词,居然无论怎么设置,用request读取的网页内容中都包括很多乱码,不知道是我程序的问题还是baidu的设置,有高手可以帮我试下嘛,用request方法直接读取这个网址就可以http://www.baidu.com/s?q1=002179&amp;q2=&amp;q3=&amp;q4=&amp;rn=100&a……

只要拿一个页面的几个关键词乱码嘛?看看接受编码是什么?设置那个页面的编码为相应的编码
解决方案八:
将编码换成gb2312或者utf-8
解决方案九:
<metahttp-equiv="content-type"content="text/html;charset=gb2312">
解决方案十:
stringhtml="";HttpWebRequesthWebRequest=(HttpWebRequest)WebRequest.Create(uri);WebResponseResponse=hWebRequest.GetResponse();HttpWebResponsewr=(HttpWebResponse)hWebRequest.GetResponse();StreamReadersr=newStreamReader(Response.GetResponseStream(),Encoding.GetEncoding("UTF-8"));//这里设置编码html=sr.ReadToEnd();

解决方案十一:
编码问题
解决方案十二:
这个和系统区域环境设置有关
解决方案十三:
看看与百度的编码是否一致?
解决方案十四:
用gb2312读取
解决方案十五:
设置格式为"UTF-8"是正解,但是很奇怪,baidu搜索的页面似乎是采用了不同的编码方法,不同词对应着不同的编码方法
解决方案:
在他是参数里有ie=gb2312oe=gb2312则编码为gb2312默认为utf-8引用14楼的回复:

设置格式为"UTF-8"是正解,但是很奇怪,baidu搜索的页面似乎是采用了不同的编码方法,不同词对应着不同的编码方法

时间: 2024-09-16 08:56:22

c#读取的网页中文总是乱码的相关文章

如何解决HTML网页中文显示乱码的方法

第一:定义网页显示编码.如果不定义网页编码,那么我们浏览网页的时候,IE会自动识别网页编码,这就有可能会导致中文显示乱码了.所以我们做网页的时候,都会用"<meta http-equiv="Content-Type" content="text/html; charset=utf-8″>"来定义网页编码.(我们常见的Unicode码是utf-8) <html> <meta http-equiv="Content-Ty

PHP中使用file_get_contents抓取网页中文乱码问题解决方法_php技巧

本文实例讲述了PHP中使用file_get_contents抓取网页中文乱码问题解决方法.分享给大家供大家参考.具体方法如下: file_get_contents函数本来就是一个非常优秀的php自带本地与远程文件操作函数,它可以让我们不花吹挥之力把远程数据直接下载,但我在使用它读取网页时会碰到有些页面是乱码了,这里就来给各位总结具体的解决办法. 根据网上有朋友介绍说原因可能是服务器开了GZIP压缩,下面是用firebug查看我的网站的头信息,Gzip是开了的,请求头信息原始头信息,代码如下: 复

DW MX 2004网页中文乱码问题:常见原因

网页|问题|中文|中文乱码 用DW2004编辑网页的时候,很多朋友经常会遇到中文乱码的情况.你遇到过么? 我们先来看看网页中的中文乱码一般是怎么出现的. 也许很多时候用其他软件(比如Editplus)写程序的时候,忘了meta标签里面设定编码.然后当需要用Dreamweaver编辑修改时,中文的乱码就来了. 如下:这是一份我自己写的ASP源文件,现用记事本打开 你可以看到内容,中文显示完全正常 OK,那么用DW2004来查看吧:惨了,中文全是乱码 怕什么,不着急,下节我们看看有什么可行的解决方法

gdal中文乱码-GDAL11.1版本不支持中文路径,读取shp文件属性字段出现乱码

问题描述 GDAL11.1版本不支持中文路径,读取shp文件属性字段出现乱码 首先读取带有中文路径的shp文件,代码如下: string strShpFullName = @"G:学习资料ArcGIS空间数据ATShpBoundaryChina_Boundary.shp"; //注册Ogr Ogr.RegisterAll(); OSGeo.GDAL.Gdal.SetConfigOption("GDAL_FILENAME_IS_UTF8", "NO"

groovy读取文件,中文乱码

问题描述 linux服务器上,groovy读取文件,中文乱码.无论我怎么改服务器的编码方式都不行,请大神们赐教啊!!! 解决方案 解决方案二:自己顶一下!解决方案三:可以断点跟着调试吗,先确定是哪一步乱码了的,然后想办法解决乱码解决方案四:引用2楼magi1201的回复: 可以断点跟着调试吗,先确定是哪一步乱码了的,然后想办法解决乱码 f.eachLine{line->println(line.replace('',''));}直接就乱码了,本地环境不会乱码,放到服务器上就乱码.解决方案五:用u

中文乱码-读取python遍历中文目录得到的文件路径报错

问题描述 读取python遍历中文目录得到的文件路径报错 各位朋友们好,我是一名python新手,现在遇到一个问题,恳请各位朋友们能指点一下我. 我的环境是:ubuntu14.04系统,python2.7 用python遍历一个目录,目录层次结构如下: 这是主目录: /home/chaoma/superboard/mydata/input/production 主目录下的目录层次结构如下 --超级画板教学资源_全处理_772 -- Z+Z资源库 --初中数学资源库 --1有理数 ---1.1数的

Response.AddHeader使用实例收集 如何做下载,下载中文显示乱码怎么办 ContentType类型大全

非常有用的文章~!~!忘记的时候可以来查找一下... 文件下载,指定默认名srxljl Response.AddHeader("content-type","application/x-msdownload"); Response.AddHeader("Content-Disposition","attachment;filename=要下载的文件名.rar"); 刷新页面srxljl Response.AddHeader &

escape函数解决js中ajax传递中文出现乱码问题_javascript技巧

本文实例讲述了escape函数解决js中ajax传递中文出现乱码问题,分享给大家供大家参考.具体方法如下: 一.问题描述: 本来网页特效中的escape()是将中文按iso-8859-1字符集进行url编码的,那样通过 request.getparameter()是能直接获取到请求参数的,但后来的javascript将escape()换成了unicode字符集编 码,如此一来,在jsp教程和servlet中就没法直接拿到请求参数了,具体原因我也不知道. 二.解决办法: 1.首先对中文字符进行两次

multipart ile-MultipartFile上传文件时,中文文件名乱码怎么解决?

问题描述 MultipartFile上传文件时,中文文件名乱码怎么解决? package com.upload; import java.io.File; import java.io.IOException; import java.text.SimpleDateFormat; import java.util.Date; import javax.servlet.http.HttpServletRequest; import org.springframework.stereotype.Co