问题描述
请问用urllib2.open()获取网页信息的时候,中文不能显示,怎么解决?网上搜索了一些没搞定,请教一下out[4] = ' <meta name="keyword" content="JavaEye,IT,xe5xbcx80xe5x8fx91,xe4xbaxa4xe6xb5x81,xe7xa4xbexe5x8cxba,java, ruby, ajax, agile" />n'都是这种显示,不知道怎么解决,谢谢 问题补充:RyanPoy 写道
解决方案
首先, 道个歉. 原因是昨天手快, 敲错了. 这个字体是: utf8的. 不是gbk的.然后, 终端字符集是和系统相关的. 在bsd下面, csh, 修改 .cshrc: setenv LANG zh_CN.UTF-8在linux下面, bash, 修改 .bashrc:export LANG="zh_CN.UTF-8"在mac下面, bash, 修改 .bash_profile:export LANG="zh_CN.UTF-8"在win下面, 抱歉, 我也不知道. 如果你是用的win, 那么, 你这样子试试看: print out[4].decode('utf-8').encode('gbk')
解决方案二:
这个编码是正确的,看着是gbk编码。估计你是终端设置的字符集不对。
时间: 2024-10-02 15:31:31