httpclient4.x编码问题

问题描述

我在使用httpclient4.x的时候发现如下代码能够有一定几率识别网页的编码。DefaultHttpClient hc = new DefaultHttpClient();HttpGet httpget = new HttpGet("http://www.baidu.com/");HttpResponse response = hc.execute(httpget);HttpEntity entity = response.getEntity();entity = new BufferedHttpEntity(entity);String htmltext = EntityUtils.toString(entity);只要用String encode = EntityUtils.getContentCharSet(entity);就能验证网站编码有没有被识别。但是有一些网站却无法自动识别编码，比如www.hudong.com，它的getContentCharSet(entity)返回值是null。这是为什么呢？httpclient本身的识别编码是采用了怎么样的机制呢？

解决方案

引用原理是这样的，在请求的返回header中获取编码，如果没有找到返回的编码,而程序也没有指定默认的编码，自然就得到null了。最好这个地方设置一个默认的编码。可以参考文章：http://dh189.iteye.com/blog/732111
解决方案二：
原理是这样的，在请求的返回header中获取编码，如果没有找到返回的编码,而程序也没有指定默认的编码，自然就得到null了。最好这个地方设置一个默认的编码。

时间： 2024-11-05 21:39:00

httpclient4.x编码问题的相关文章

改编码-httpclient4+怎么禁用编码(Content-Transfer-Encoding)

问题描述 httpclient4+怎么禁用编码(Content-Transfer-Encoding) httpclient当POST表单时使用了Content-Type:multipart/form-data时表单自动编码了:如下 POST ------------------ HTTP/1.1Accept-Encoding: gzipdeflateContent-Type: multipart/form-data; boundary=MIME-Version: 1.0Content-Lengt

HttpClient4.3 第二次封装

httpclient.java package com.httpclint.util; import java.io.File; import java.io.IOException; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import org.apache.http.HttpException; import org.apache.http.entity.mime.content.B

详解Eclipse Galileo中的快速Java编码

问题无论您的项目或团队的规模有多大,在编辑代码库时,都会遇到如下的两个问题: 代码模板尽管代码模板是提高工作效率的一个理想途径,但需要确保不能用模板来替代真正的重用,即编写方法或函数以便将它们用于许多位置.如果您有一大段代码,那么最好在使用代码模板前先考虑采用带有变量的各种方法. 缺乏一致性 - 当团队中的很多人编辑文件时,难免会有编码上的些许差异,但这些差异会使代码变得难于读懂和维护.这种情况下,很难搜索到代码差异在何处发生.即便代码是您一个人写的,如果您忘记了前面代码是如何编

outofmemoryexception-VS2013 coded ui test 编码的UI测试导致程序内存溢出

问题描述 VS2013 coded ui test 编码的UI测试导致程序内存溢出我在使用VS coded ui test对一个Winform的程序做自动化测试的时候,每次都在最后抛出OutOfMemoryException的异常,不知道怎么解决. 大家能不能帮忙解决下? 有没有什么方法控制或者监测内存使用情况啊?

文件名的字符编码和c的fopen函数问题

问题描述文件名的字符编码和c的fopen函数问题问一个问题,文件名的存储和文件名的显示应该是两回事吧中文版windows的环境字符集是GBK GBK中"茅"的编码是 195 169(十进制) 如果我在中文版windows里看到个文件叫"a茅" 那么他的文件名在硬盘中的存储方式应该是97 195 169 我编了个c程序如下: FILE *fp; char b[100]={'a',195,169,0}; strcat(b,".html"); i

PHP编码规范-php coding standard

standard|编码|规范目录介绍标准化的重要性解释认同观点项目的四个阶段命名规则合适的命名缩写词不要全部使用大写字母类命名类库命名方法命名类属性命名方法中参数命名变量命名引用变量和函数返回引用全局变量定义命名 / 全局常量静态变量函数命名 php文件扩展名文档规则评价注释 Comments Should Tell a Story Document Decisions 使用标头说明 Make Gotchas Explicit Interface an

编码练习：猴子捡桃

插入前面:这段内容本来在下面猴子分桃题目之前是没有的,想看题,可以先看后面的题目,然后看着插入在前面的关于递归实现下面问题的代码,为什么要突然放在前面,因为这是一部分比较重要的内容,是个思想锻炼的结果和总结,另外最后吗还给出了错误的代码以及错误的原因可以对比理清思路: 1 #include <iostream> 2 using namespace std; 3 4 5 int recursion(int time,int n) 6 { 7 int sum; 8 if (time == 0) {

探秘视频编码黑科技，窄带高清2.0视觉模型及场景实战

"黑科技"这个词已经成为了今年云栖大会的关键词.那么,在我们熟知的视频领域,什么才算是黑科技呢? 我们知道,在通常情况下,视频画质越好带宽费用肯定越高,带宽又是视频服务中占比很高的一项成本,很多开发者都在寻求效果与成本的平衡点.那么,有没有一种技术,能够在保证甚至提高视频画质的同时,降低带宽呢?如果有的话,小编觉得这一点可以算是黑科技了吧. 今天,小编就带大家来了解下刚刚在云栖大会上重磅发布的阿里云窄带高清2.0,看看它是如何超越压缩极限,在视觉效果和带宽成本中找到平衡的. 首先,我们

关于ISO-8859-1编码

在Java的一些程序中经常可以看到有这样的代码: String.getBytes("ISO-8859-1") . 虽然我是大概知道这个是以单字节来解码的,我也不写这样的代码.但是见得多了,总要多了解下. 以下from http://baike.baidu.com/view/2613676.htm ISO-8859-1 ISO-8859-1编码是单字节编码,向下兼容ASCII,其编码范围是0x00-0xFF,0x00-0x7F之间完全和ASCII一致,0x80-0x9F之间是控制字符,0

猜你喜欢

Masm for Windows集成开发环境编写汇编程序

由于最近在学习汇编,用的软件是一款叫"Masm for Windows集成开发环境",但是发现该软件的资料比较少,对于我们这样刚刚学习汇编的同学,我查找了很多资料,下面主要是介绍该 ...

解决JSP中rs.getString()的换行问题

js|解决|问题最近用JSP做新闻发布时发现,用rs.getString()获得的字符串里面空格和换行都表现不出来, 先分析原因,我用的是Mysql数据库,新闻内容采用的是Text类型,查看数据库中 ...

如何用系统扫描日志修复系统

[文字说明] 1.首先启动到安全模式(启动时候按F8选择safemode) ★★★★安全模式是必须的,否则一切都是扯淡!!!!★★★★ 不是安全模式下删不干净. 2.运行Hijackthis... 3 ...

张朝阳的誓言不可信

9月伊始,随着<Alexa再次调整算法打击作弊搜狐排名大幅下跌>这篇文章的发表,将搜狐新浪的Alexa排名之争推向了一个新的高潮.霎那间,近乎所有的网络媒体都在争相关注和报道此次Alex ...

Delphi全面控制Windows任务栏

使用Windows95/NT/98操作系统的用户知道:Windows正常启动后,在电脑屏幕下方出现一块任务栏.从系统功能角度而言,整个任务栏包括几个不同的子区域,从左至右依次是:开始按钮.应用程序 ...

Java 6 RowSet使用完全剖析

C# 提供了 DataSet,可以将数据源中的数据读取到内存中,进行离线操作,然后再同步到数据源.同样,在 Java 中也提供了类似的实现,即 RowSet.javax.sql.rowset 包下,定 ...

Win8系统无法打开IE10浏览器怎么解决？

Win8系统无法打开IE10浏览器怎么解决? 1.点击"WIN+R"快捷键,将运行窗口打开,在里面输入"regedit"字符,就可以打开注册表编辑器; 2. ...

u盘拷贝文件过大怎么解决大文件无法复制到U盘怎么办？

u盘拷贝文件过大怎么解决大文件无法复制到U盘怎么办大文件无法复制到U盘怎么办?u盘拷贝文件过大解决办法先来说说U盘无法复制大文件的原因: 一般来说,导致U盘无法拷贝大文件,一般是4GB以上 ...

如何在Gmail中查看PDF、Word、Excel等格式文件

现在,你将不必再需要从你的Gmail账户上面下载PowerPoint和TIFF文件,而是直接在Gmail中查看他们,因此,到目前为此,Gmail已经支持PDF.Word.Excel.PowerPoin ...

Win8.1升级Win10系统发生错误提示“0x80070005-0xA0019”怎么办

解决方法: 方法一:以管理员身份登录某些更新需要管理权限才能安装,以管理员身份登录也许能帮您解决该问题. 在您以管理员身份登录后,请尝试再次安装此更新. 方法二:扫描恶意软件恶意软件感染也可能 ...

jQuery实现点击该行即可删除HTML表格行

jQuery的已成为所有时刻的最常用和最喜爱的JavaScript框架之一.它不仅不会减少在JavaScript编码简单的技术开销,而且也使您的代码的跨浏览器兼容.我已经写了许多关于jQuery教程 ...

MYSQL分页limit速度太慢优化详解

在mysql中limit可以实现快速分页,但是如果数据到了几百万时我们的limit必须优化才能有效的合理的实现分页了,否则可能卡死你的服务器哦. 当一个表数据有几百万的数据的时候成了问题! 如 * f ...

bind主从配置

原创作品,允许转载,转载时请务必以超链接形式标明文章原始出处 .作者信息和本声明.否则将追究法律责任.http://navyaijm.blog.51cto.com/4647068/1698305 一 ...

目标关键词具有哪些特征

摘要: 目标关键词,指经过关键词分析确定下来的网站主打关键词,通俗地讲指,网站产品和服务的目标客户可能用来搜索的关键词. 一般情况下,目标关键词具有这些特征: 目标关键词一目标关键词,指经过关键词分 ...

视频播放-急！！！视频在线播放？在jsp里通过传入一个流实现播放本地视频？怎么边加载边播放啊？

问题描述急!!!视频在线播放?在jsp里通过传入一个流实现播放本地视频?怎么边加载边播放啊? 在后台的action 写了一个这个并且把一个流传到了前台 InputStream fis = new ...

手机之外的入口在哪里

除了自主品牌的手机终端,中国移动正在推动更多的自有硬件产品上市. 6月10日,据21世纪经济报道记者了解,在中国移动的音乐.视频.游戏.位置等基地业务中,已经有多个基地在谋划硬件产品. 其中,上海视频 ...

python从ftp下载数据保存实例_python

<hadoop权威指南>的天气数据可以在ftp://ftp3.ncdc.noaa.gov/pub/data/noaa下载,在网上看到这个数据好开心,打开ftp发现个问题,呀呀,这么多文件啊 ...

一种基于MapReduce的并行聚类模型

一种基于MapReduce的并行聚类模型顾瑞春王静宇在对海量数据进行聚类的过程中,传统的串行模式局限性越来越明显,难以在有效时间内得出满意结果的问题,本文提出一种基于Hadoop 平台下Map ...

埃里森眼里的佩奇

甲骨文CEO拉里·埃里森一向心直口快,近期在接受<CBS早安>电视节目主持人查理·罗斯采访时,他更是直言不讳,称他不喜欢谷歌首席执行官拉里·佩奇. 埃里森之所以对佩奇持有这种态 ...

帮助您在云设备中安装一个恰当配置的应用程序最佳实践

将应用程序部署到云中的一个常见场景是一个拥有非云软件的场景,您想要将这些非云软件集成到已在云中运行的软件中,要做到这一点,有几个特性需要计划(如果您仍在修复有问题的应用程序)或集成(如果应用程序已存在 ...

php验证手机号码_php技巧

大家都应该有这个常识,中国的手机号码都是以数字"1"开头,然后利用"0~9"10个数字组成的11位数字组合,那么我们的验证规则肯定要根据这个思路来写. 根据上面 ...

Python中实现字符串类型与字典类型相互转换的方法_python

本文以实例形式简述了Python中字符串类型与字典类型相互转换的方法,是比较实用的功能.具体方法如下: 一.字典(dict)转为字符串(string) 我们可以比较容易的将字典(dict)类型转为字符 ...

苹果CEO库克在两份CEO排名榜居首位(图)

苹果CEO库克在两份CEO排名榜上占据首位新浪科技讯北京时间3月30日凌晨消息,据职业服务公司Glass Door公布的CEO排名榜单显示,苹果CEO蒂姆·库克(Tim Cook)在"科技 ...

进度条的前世和今生

只要是和科技产品打交道的用户,进度条已经是随处可见的身影,不管是Windows 7的蓝色进度条还是Windows 8的绿色进度条,进度条从0到100%,从空到满的过程,相比用户基本上都习以为常了.可是 ...

c#-对二维数组如何使用户输入赋值

问题描述对二维数组如何使用户输入赋值对二维数组如何使用户输入赋值? num1[0,0] = Convert.ToInt32(Console.WriteLine()); 解决方案 Console.R ...

中国工程院院士邬贺铨：5G为光通信带来发展新机遇

2016年11月3日,由CRU和长飞光纤光缆股份有限公司联合主办的首届世界光纤光缆大会在中国光谷隆重举行.会议汇聚了光通信行业内的多位权威专家,其中中国工程院院士邬贺铨从我国宽带以及互联网发展对光通信 ...

SEO价格越来越白菜接单将何去何从

摘要: SEO现阶段还是一个非常热门的行业,笔者经常会遇到一些打算从事SEO工作的朋友咨询SEO的前景如何,说句心里话,笔者对于SEO的前景并不看好.当然这只是笔者个人的看法,不能代表什 SEO现阶段 ...

[文档]Intercloud Message Exchange Middleware

Intercloud Message Exchange Middleware Muhammad Bilal Amin Wajahat Ali Khan Ammar Ahmad Awan Sungyou ...

中国电信用户使用Wi-Fi上网可免输账号密码

11月5日上午消息,近日,用户在使用中国电信无线宽带3G上网业务时,收到了产品功能升级的小贴士,提醒无线宽带新增了统一认证功能.据了解,该功能是在中国电信WLAN热点覆盖区域,用户只需在电脑中插入无线 ...

Java反射机制与应用

JAVA反射机制 JAVA反射机制是在运行状态中,对于任意一个类,都能够知道这个类的所有属性和方法:对于任意一个对象,都能够调用它的任意一个方法:这种动态获取的信息以及动态调用对象的方 ...

热搜

© 2024 iVAN | info#iamivan.net | 12 q. 0.020 s.