python-Python编码问题,cgi脚本输出BeautifulSoup处理的中文内容(decode处理)出错

问题描述

Python编码问题,cgi脚本输出BeautifulSoup处理的中文内容(decode处理)出错
 最近写一个程序,想要先用BeautifulSoup处理一个html页面,然后再输出一下到我的一个python写的cgi页面上,因为一些中文字符都是X**的格式,网上查了说BeautifulSoup输出的是unicode字符。然后需要把字节类型的转为字符输出。在ide中是可以正常转换的。
 但是使用cgi脚本在浏览器中浏览时就会出错,报一个UnicodeEncodeError: 'gbk' codec can't encode character 'xa0' in position 89: illegal multibyte sequence 错误,不清楚是为什么。网上有人说输出的文件是gbk编码导致的,但是我的是html页面,所以不知道如何处理,希望大牛帮忙解答。或者推荐我有关python编码的书也可以,很想弄明白这是为什么。

我使用的版本是python3.3

时间: 2024-09-13 13:08:33

python-Python编码问题,cgi脚本输出BeautifulSoup处理的中文内容(decode处理)出错的相关文章

不错的一篇学习CGI脚本(脚本)_基础教程

学习CGI脚本(脚本)CGI 意思为 Common Gateway Interface, 一种基于浏览器的输入.在Web服务器上运行的程序方法. CGI脚本 使你的浏览器与用户能交互,为了在数据库中寻找一个名词, 提供你写入的评论,或者从一个表单中选择几个条目并且能得到一个明确的回答. 如果你曾经遇到过在web上填表或进行搜索, 你就是用的CGI脚本. 你那时也许没有意识到,因为大部分工作是在服务器上运行的,你看到的只是结果. 作为一个网页设计者, 你创建客户端的 CGI脚本, 服务器端的程序用

CGI脚本入门学习资料_其它

CGI脚本是什么? CGI脚本是怎样工作的? 一个简单的例子 我能用CGI脚本吗? 你的服务器配置允许CGI脚本吗? 你能编程吗? 你应该用什么编程语言? 你的服务器设置正确吗? 如果你的服务器不是UNIX系统呢? 解剖CGI脚本 输出头部 输出数据部 带阐述的脚本 传递其他信息给脚本 创建特殊的脚本输出 以装载另一个文本响应 无响应 处理表单的脚本 表单格式和表单脚本 GET 和 POST URL 编码 问题 CGI 变量 解码程序 uncgi cgi-lib.pl 解码文件上传的输入 自己做

编写Python CGI脚本的教程

  这篇文章主要介绍了编写Python CGI脚本的教程,CGI是Python和服务器软件连接的接口,需要的朋友可以参考下 你是否想使用Python语言创建一个网页,或者处理用户从web表单输入的数据?这些任务可以通过Python CGI(公用网关接口)脚本以及一个Apache web服务器实现.当用户请求一个指定URL或者和网页交互(比如点击""提交"按钮)的时候,CGI脚本就会被web服务器启用.CGI脚本调用执行完毕后,它的输出结果就会被web服务器用来创建显示给用户的

如何创建和使用Python CGI脚本

如何创建和使用Python CGI脚本 你是否想使用Python语言创建一个网页,或者处理用户从web表单输入的数据?这些任务可以通过Python CGI(公用网关接口)脚本以及一个Apache web服务器实现.当用户请求一个指定URL或者和网页交互(比如点击""提交"按钮)的时候,CGI脚本就会被web服务器启用.CGI脚本调用执行完毕后,它的输出结果就会被web服务器用来创建显示给用户的网页. 配置Apache web服务器,让其能运行CGI脚本 在这个教程里,我们假设

【原创】Python 源文件编码解读

以下内容源于对 PEP-0263 的翻译和解读,同时给出了一些网上网友的说法.  ========  我是分割线 ========  PEP 0263 -- Defining Python Source Code Encodings  [摘要]       给出声明 Python 源文件编码的语法.该编码信息后续会被 Python 解析器用于解析源文件.       这种方式增强了对源文件中 Unicode 编码字的处理.  [问题]       Python 2.1 时代,Unicode 字符

python shell使用printf打印为何输出的是长度?

问题描述 python shell使用printf打印为何输出的是长度? 解决方案 这是idle的问题,它只输出返回结果,标准输出并没有重定向到它的模拟器 可用python原生解释器或ipyhon代替 解决方案二: 打印的是返回值 解决方案三: printf的返回值 解决方案四: 在cmd命令行中运行一下你的脚本. msvcrt.printf 输出到标准输出设备上,并不一定是python中的sys.stdout. 在python解析器的交付式环境中sys.stdout不是标准输出设备.

python备份脚本提示文件名,目录或卷标语法出错(Windows7)

问题描述 python备份脚本提示文件名,目录或卷标语法出错(Windows7) 1C #Filename:backup_ver1.py import osimport time #1.the files and directories tobe backed up are specified in a listsource=['D:LibraryPcb''D:LibraryPLD'] target_dir='F:DD' target=target_dir+time.strftime('%Y%m

php调用python失败 在终端执行有输出,在浏览器上没有输出

问题描述 php调用python失败 在终端执行有输出,在浏览器上没有输出 这是python脚本 #!/usr/bin/python m?=?3.12345612345 print?(m); 这是PHP的脚本 <?php $output=shell_exec('python?helloworld.py'); echo" $output "; ?> 这样调用时浏览器是可以输出结果的 但是当Python脚本为: #!/usr/bin/python import?epics m?

快速入手Python字符编码_python

前言 对于很多接触Python的人而言,字符的处理和语言整体的温顺可靠相比显得格外桀骜不驯难以驾驭. 文章针对Python 2.7,主要因为3对的编码已经有了很大的改善并且实际原理一样,更改一下操作命令即可. 了解完本文,你可以轻松解决文字处理,特殊平台(Windows?)下的编码,爬虫编码等问题. 阅读建议 本文分为如下几个部分:     1.原理     2.具体操作     3.建议的使用习惯     4.疑难问题解答 如果想要了解我给出的使用习惯,可以直接跳到建议的使用习惯. 如果只想要