urllib2获取网页信息时的中文编码

问题描述

请问用urllib2.open()获取网页信息的时候，中文不能显示，怎么解决？网上搜索了一些没搞定，请教一下out[4] = ' <meta name="keyword" content="JavaEye,IT,xe5xbcx80xe5x8fx91,xe4xbaxa4xe6xb5x81,xe7xa4xbexe5x8cxba,java, ruby, ajax, agile" />n'都是这种显示，不知道怎么解决，谢谢问题补充：RyanPoy 写道

解决方案

首先, 道个歉. 原因是昨天手快, 敲错了. 这个字体是: utf8的. 不是gbk的.然后, 终端字符集是和系统相关的. 在bsd下面, csh, 修改 .cshrc: setenv LANG zh_CN.UTF-8在linux下面, bash, 修改 .bashrc:export LANG="zh_CN.UTF-8"在mac下面, bash, 修改 .bash_profile:export LANG="zh_CN.UTF-8"在win下面, 抱歉, 我也不知道. 如果你是用的win, 那么, 你这样子试试看: print out[4].decode('utf-8').encode('gbk')
解决方案二：
这个编码是正确的，看着是gbk编码。估计你是终端设置的字符集不对。

时间： 2024-10-02 15:31:31

urllib2获取网页信息时的中文编码的相关文章

php curl登陆qq后获取用户信息时证书错误

这篇文章主要介绍了php curl登陆qq后获取用户信息时证书错误,需要的朋友可以参考下今晚开放ecmall商城的QQ登陆功能,在回调时产生错误,file_get_contents函数执行时,没有抓取到正确的信息,于是改用curl,但是提示证书错误. 在网上找到了解决方法,就是去掉证书认证. 代码如下: curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, FALSE); curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, FALSE)

java-求 htmlunit + jsoup 获取网页信息实例

问题描述求 htmlunit + jsoup 获取网页信息实例求 htmlunit + jsoup 获取网页信息实例包括htnlunit获取js里的内容

获取网页信息求教

问题描述获取网址:Http://opac.nlc.cn/F获取查询后的书目信息,查询结果要切换到MARC格式后获取,需要获取的内容在网页源码中找不到,应该用什么方法获取呢解决方案解决方案二:用fiddler调试下,看是不是ajax请求获取的数据.解决方案三:怎么样确定是AJAX请求获取的数据呢或者说如果是AJAX请求获取的怎样取得需要的信息呢解决方案四:引用1楼caozhy的回复: 用fiddler调试下,看是不是ajax请求获取的数据. 怎么样确定是AJAX请求获取的数据呢或者说如果是A

myeclipse中servlet获取网页信息。

问题描述大侠们,跪求了.相当于页面中右击获取源代码那样的信息.

php curl登陆qq后获取用户信息时证书错误_php实例

今晚开放ecmall商城的QQ登陆功能,在回调时产生错误,file_get_contents函数执行时,没有抓取到正确的信息,于是改用curl,但是提示证书错误. 在网上找到了解决方法,就是去掉证书认证. 复制代码代码如下: curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, FALSE); curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, FALSE); 该种方法可行. 网上还有另外一种说法,就是使用复制代码代码如下: cur

请问C#如何判断网页能否正常访问，以及如何获取网页上的错误信息。

问题描述请问C#如何判断网页能否正常访问,以及如何获取网页上的错误信息.例如:网页能访问,其中部分模块报错,如读数据库报错.这些信息如何获取?另外,我通过ie可以访问一个网站的首页,速度较慢,但是我通过c#的ping命令获取到的信息是超时(这个应该是防火墙的原因吧),用HttpWebRequest获取网页信息也是无法访问,这应该如何解决? 解决方案解决方案二:错误消息自己捕获记录,用log4net好点http访问和ping没有关系解决方案三:我是远程判断别人的网页是否有错

[python] 常用正则表达式爬取网页信息及分析HTML标签总结

这篇文章主要是介绍Python爬取网页信息时,经常使用的正则表达式及方法.它是一篇总结性文章,实用性比较大,主要解决自己遇到的爬虫问题,也希望对你有所帮助~ 当然如果会Selenium基于自动化测试爬虫.BeautifulSoup分析网页DOM节点,这就更方便了,但本文更多的是介绍基于正则的底层爬取分析. 涉及内容如下: 常用正则表达式爬取网页信息及HTML分析总结 1.获取<tr></tr>标签之间内容 2.获取<a href..></a>超链接之间内容

html5获取地理位置信息API

html5获取地理位置信息API 在HTML5中,可以看下如何使用Geolocation API来获得用户的地理位置信息,如果该浏览器支持的话,且设备具有定位功能,就能够直接使用这组API来获取当前位置的信息,该API可以应用在移动设备上的地理定位:为window.navigator 对象新增了一个geolocation属性,可以使用Geolocation API来对该属性进行访问.window.navigator对象中的geolocation属性有三个方法如下: 第一个方法是:ge

c#获取网页中的图片已实现，如何不通过点击按钮让图片自动绑定到picturebox中

问题描述 c#获取网页中的图片已实现,如何不通过点击按钮让图片自动绑定到picturebox中也就是说,利用webborwse获取网页信息后,不通过任何操作就可以让图片显示到pixturebox中解决方案解决方案二:在webBrowser的DocumentCompleted事件中添加就行.解决方案三:你是如何通过点击按钮过去图片的.还是用同样的方法呀,就在1楼说的那个事件里,下载图片就行了.

猜你喜欢

bae中action跳转jsp出现异常

问题描述 bae中action跳转jsp出现异常我的那个项目在本机上测试时action跳转jsp可以跳转, 在bae上面就出现 HTTP ERROR 404 Problem accessing /s ...

甲骨文向MySQL用户开发者客户做出十项承诺

最近时期甲骨文与SUN公司的合并是许多开发者十分关注的问题,主要因为MYSQL这一数据库的易主可能会引起新的变化,本周甲骨文向MySQL用户.开发者.客户做出十项承诺. 甲骨文公司与欧盟委员会就甲骨文 ...

网管人员必备的网络命令(转贴)

网管|网络网管人员必备的网络命令如果你玩过路由器的话,就知道路由器里面那些很好玩的命令缩写. 例如,"sh int" 的意思是 "show interface&q ...

sqlserver 2005 如何创建分区表

server|sqlserver|创建该文详细介绍实现分区表的过程以及有助于完成此过程的功能.逻辑流程如下:图:创建分区表或索引的步骤确定是否应为对象分区虽然分区可以带来众多的好处,但也增加了实 ...

浅谈如何创建一个杀手级的SEO团队

每一家公司都希望自己有一个完善的网络营销团队,一个由有远见.敬业.热情的员工组成的团队.挑战可以塑造一个素质.技能和个性平衡的团队朝正确的方向发展.笔者发现很多公司都会犯一个共同的常见的误解,认为 ...

java集合框架中List的定义及注意事项

大家知道,集合框架是为了表示和操作集合而规定的一种统一的标准的体系结构,学习集合知识有利于我们解决一系列例如保存数据与对象的问题. 常用的集合在系统中定义了两大接口,List和Set 这里我们就来讨论 ...

WCF从理论到实践(9):实例模式和对象生命周期

在上文WCF从理论到实践:事件广播中,已经实现了完整的WCF服务端和客户端示例,其中也涉及到了远程对象实例创建的问题.本文就进一步的探索WCF中远程对象的创建模式和其生命周期本文出发点: 通过阅读 ...

Microsoft数据访问技术简介

在介绍SQL Native Client编程之前,首先来了解一下Microsoft提供的所有数据访问技术,以便读者能够对这些技术有一个全面的了解,从而选择出适合自己的方式来连接到SQL Server ...

NHibernate.Search：基于Lucene.NET的全文索引

NHibernate.Search现在是NHiberante Contrilb下面的一个还没有发布的项目,也是从 Hibernate.Search移植而来,把NHibernate和Lucene.NET ...

Photoshop打造帅气的指示框

打造一个帅气的指示框,可用于盒子的标题,下面展示最终效果图. 一.建立文件,400*100px,72dpi,背景白色. 二.画一个长方形,选择>修改>平滑,填入2px. 三.混合选项> ...

如何获取Windows 8.1 Update升级

Windows 8.1 Update已经正式发布一周了,有部分小伙伴说自己还没有收到推送,其实这可能是您设置不正确而错过了推送.不过没关系,下面系统之家小编就为大家介绍一下如何获取Windows ...

如何在Win7 ghost 纯净版系统桌面上创建关机快捷方式实现快速关机

1.首先在win7 ghost 纯净版系统桌面上空白处鼠标,点击新建选择"快捷方式(S)"; 2.在创建快捷方式窗口中,我们在对象的位置中输入"shutdown –s ...

关于J2EE

问题描述群号码:76996648 解决方案解决方案二:进来看看

android 有办法监听手机有没有发出声音或获取当前发出声音的音量吗

问题描述 android 有办法监听手机有没有发出声音或获取当前发出声音的音量吗又或者说监听当前手机自己发出的声音的分贝,急急急, 求解决解决方案个人认为,你得和硬件人员先沟通下 ...

Continue

User Interface - How the user interacts with the product is very important, in part because in some ...

trinidad &amp;lt;tr:table&amp;gt;列表中列排序column sort，但排序后的记录rowkey值对应有错误，请给予帮助

问题描述 trinidad<tr:table>列表中列排序columnsort,如下代码:<tr:columnnoWrap="true"sortProperty= ...

[喵咪Redis]Redis安装与介绍

[喵咪Redis]Redis安装与介绍前言哈喽大家好啊,这次要来和大家一起来了解学习Redis的一系列技术,最终目的是搭建一个高可用redis集群自动负载灾备,那我们先从最基础的Redis的一些基 ...

android pcm 科大讯飞-如何播放科大讯飞录音后的pcm？

问题描述如何播放科大讯飞录音后的pcm? 用这个方法播放的话全是噪音,因为播放要在listview的item中进行,而且要有图片的变换,所以用thread效果不好. public void play ...

android乱码-android虚拟器不乱码真机测试乱码

问题描述 android虚拟器不乱码真机测试乱码项目中有地图API ,侧滑菜单还有出柜布局,在真机上滑动几次之后就会出现乱码,在oppo,步步高,华为,小米测试结果都是会发生乱码问题解决方案应 ...

同学帮改肤色检测（未完成版）

直接代码: #include "cv.h" #include "highgui.h" #include <opencv2/highgui/highgui. ...

360为啥要私有化？看完彻底明白了！

奇虎360今天宣布与投资者联盟达成最终协议,以大约93亿美元(600亿元人民币)的现金价格被后者收购,并从纽交所退市,从而完成私有化. 这笔交易将成为在美上市的中国公司中最大规模的私有化交易. 那么, ...

《液晶显示器和液晶电视维修核心教程》——第1章液晶显示器维修概要1.1　液晶显示器的基本知识

第1章液晶显示器维修概要液晶显示器(LCD)是最近几年刚兴起的一种新型显示设备,它以轻薄.低功耗.零辐射.高清晰度等优点,已越来越多地受到人们的青睐.同样采用液晶显示原理的显示设备还有液晶电视机. ...

如何借助 NoSQL 提高 JPA 应用性能

[编者按]关注 NoSQL 的动态发展很重要.NoSQL 的好处并不仅限于新的应用开发.在某些案例中,你可以见识到重新访问现有的.传统的框架带来的积极效果,比如说你的 JPA 的实现.本文系国内 IT ...

关于PC站和手机站不同适配方法的优缺点比较

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅随着智能手机的不断发展,移动搜索的 ...

html中table的画法及table和div的区别

最近项目中,根据客户的要求需要在页面上展示各种报表什么的,各种表格的都会出现.这里也将table的画法,做一下总结.办法虽笨但很实用.这也是从高人那里学来的,总之是屡试不爽啊.就以下面的表格为 ...

单向循环链表C语言实现

我们都知道,单向链表最后指向为NULL,也就是为空,那单向循环链表就是不指向为NULL了,指向头节点,所以下面这个程序运行结果就是,你将会看到遍历链表的时候就是一个死循环,因为它不指向为NULL,也是 ...

ActiveMQ源码架构解析第一节(转)

工作四年已久,也快到了而立之年,本人也酷爱技术,总是想找一些途径来提升自己,想着温故而知新所以就写起了博客,然而写博客这个想法也是酝酿了很久,近期也看到了有很多人在问关于ActiveMQ的相关 ...

如何让textbox中的信息更新到数据库中的列中

问题描述如何让textbox中的信息更新到数据库中的列中如何让textbox1和textbox2中的信息更新到数据库中的列中解决方案让textbox1和textbox2中的信息更新到数据库中, ...

胡余丰：软文推广中的几点个人看法

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅一篇好的软文的发表,至少可以带来三 ...

面向对象-C#多态中new 和(className)的区别

问题描述 C#多态中new 和(className)的区别 class A { public virtual void test1() { cnosole.writeline("test1 ...

热搜

© 2024 iVAN | info#iamivan.net | 11 q. 0.020 s.