Python: file: encode: ‘gbk‘ codec can‘t encode character ‘\xe5‘ in position

错误

response = requests.get(url, timeout=5) # 请求一个网页

with open('response.txt', 'w') as file: # 打开一个文件

file.write(response.text) # 向文件写入response

提示错:

UnicodeEncodeError: 'gbk' codec can't encode character '\xe5' in position 520: illegal multibyte sequence

原因

这个是因为文件打开使用的编码方式是gbk,是open默认的,在response.text里有gbkencode不了的编码。导致错误。如果换成utf-8,倒是可以输出到文件:

with open('response.txt', 'w', encoding='utf-8') as file:

修改这一句,可以绕过这个错误,但是,打开网页出现乱码。

本地的默认设置是gbk。

cpp 复制代码
>>> import locale
>>> print(locale.getdefaultlocale())
('zh_CN', 'cp936')

Doc/library/codecs.rst

cpp 复制代码
| gbk             | 936, cp936, ms936              | Unified Chinese                |

从网上搜了一下,response自带编码方式,可以查阅。

cpp 复制代码
>>> print(response.encoding)
ISO-8859-1

最后改成ISO-8859-1就好了。

相关推荐
一尘之中4 分钟前
在Python 2.7中安装SQLAlchemy的完整指南
开发语言·python·ai写作
黄贵根10 分钟前
使用JDK11标准 实现 图数据结构的增删查改遍历 可视化程序
java·开发语言·数据结构
电商数据girl11 分钟前
Python 爬虫获得淘宝商品详情 数据【淘宝商品API】
大数据·开发语言·人工智能·爬虫·python·json·php
钢铁男儿17 分钟前
Python 网络编程进阶:使用 SocketServer 模块构建 TCP 服务器与客户端
网络·python·tcp/ip
盒马盒马25 分钟前
Rust:变量、常量与数据类型
开发语言·rust
傻啦嘿哟32 分钟前
Rust爬虫实战:用reqwest+select打造高效网页抓取工具
开发语言·爬虫·rust
jokr_1 小时前
C++ 字符串与内存操作函数深度解析
java·开发语言·c++
Elieal1 小时前
深入浅出 ArrayList:从基础用法到底层原理的全面解析(上)
开发语言
大模型真好玩1 小时前
深入浅出LangChain AI Agent智能体开发教程(十)—LangChain搭建数据分析智能助手
人工智能·python·mcp
七夜zippoe2 小时前
Python性能优化实战(三):给内存“减负“的实用指南
python·内存·优化