问题描述
- Python编码问题,cgi脚本输出BeautifulSoup处理的中文内容(decode处理)出错
-
最近写一个程序,想要先用BeautifulSoup处理一个html页面,然后再输出一下到我的一个python写的cgi页面上,因为一些中文字符都是X**的格式,网上查了说BeautifulSoup输出的是unicode字符。然后需要把字节类型的转为字符输出。在ide中是可以正常转换的。 但是使用cgi脚本在浏览器中浏览时就会出错,报一个UnicodeEncodeError: 'gbk' codec can't encode character 'xa0' in position 89: illegal multibyte sequence 错误,不清楚是为什么。网上有人说输出的文件是gbk编码导致的,但是我的是html页面,所以不知道如何处理,希望大牛帮忙解答。或者推荐我有关python编码的书也可以,很想弄明白这是为什么。
我使用的版本是python3.3
时间: 2024-09-13 13:08:33