Python: file: encode: ‘gbk‘ codec can‘t encode character ‘\xe5‘ in position

错误

response = requests.get(url, timeout=5) # 请求一个网页

with open('response.txt', 'w') as file: # 打开一个文件

file.write(response.text) # 向文件写入response

提示错:

UnicodeEncodeError: 'gbk' codec can't encode character '\xe5' in position 520: illegal multibyte sequence

原因

这个是因为文件打开使用的编码方式是gbk,是open默认的,在response.text里有gbkencode不了的编码。导致错误。如果换成utf-8,倒是可以输出到文件:

with open('response.txt', 'w', encoding='utf-8') as file:

修改这一句,可以绕过这个错误,但是,打开网页出现乱码。

本地的默认设置是gbk。

cpp 复制代码
>>> import locale
>>> print(locale.getdefaultlocale())
('zh_CN', 'cp936')

Doc/library/codecs.rst

cpp 复制代码
| gbk             | 936, cp936, ms936              | Unified Chinese                |

从网上搜了一下,response自带编码方式,可以查阅。

cpp 复制代码
>>> print(response.encoding)
ISO-8859-1

最后改成ISO-8859-1就好了。

相关推荐
胖哥真不错5 分钟前
基于PyQt5和PaddleSpeech的中文语音识别系统设计与实现(Python)
python·毕业设计·语音识别·课程设计·paddlespeech·pyqt5·中文语音识别系统
微信公众号:AI创造财富17 分钟前
Pyenv 跟 Conda 还有 Poetry 有什么区别?各有什么不同?
人工智能·python·conda·tensorflow
范纹杉想快点毕业35 分钟前
Qt实现文本编辑器光标高亮技术
java·开发语言·c++·算法·系统架构
LBJ辉44 分钟前
9. CSS 引入方式
开发语言·前端·css
C语言小火车1 小时前
C语言酒店管理系统:完整源码与深度解析
c语言·开发语言
伊成1 小时前
Java面试高频面试题【2025最新版】
java·开发语言·面试
~贝母~1 小时前
猿人学js逆向比赛第一届第九题
开发语言·javascript·爬虫·ecmascript
琢磨先生David1 小时前
常见的 AI 自动编程工具:开启高效编程新时代
java·人工智能·python
编程乐趣2 小时前
推荐一个基于C#开发的跨平台构建自动化系统!
开发语言·c#·自动化
即可皕2 小时前
数据采集/分析/报告生成全链路自动化:Python实战案例拆解
python·自动化