Python爬网页,不确定网页的编码,不需要用第三方库

Python爬网页,不确定网页的编码,不需要用第三方库,自己写个判断,乱拳打死老师傅

detect试了,不好用

apparent_encoding试了,不好用

encoding试了,不好用

headers里get试了,不好用

最后用下面这个方法,反而是最好用的,也不是100%准确,但是在我用的过程中,这个是最好用的,反正也没有100%的,还不如用自己写的函数呢

python 复制代码
def detect_encoding(byte_text):  
    encodings_to_try = ['utf-8', 'gbk', 'gb2312', 'gb18030', 'ascii', 'latin1']  
    for encoding in encodings_to_try:  
        try:  
            return encoding  
        except UnicodeDecodeError:  
            continue  
    return None
相关推荐
IoT智慧学堂8 分钟前
C语言运算符与表达式详解——算术、逻辑与赋值的全面理解
c语言·开发语言
电子_咸鱼33 分钟前
高阶数据结构——并查集
数据结构·c++·vscode·b树·python·算法·线性回归
沐知全栈开发34 分钟前
深度优先遍历与连通分量
开发语言
生信大杂烩37 分钟前
Xenium数据分析 | 使用Xenium Ranger重新分析数据
python·数据分析
古城小栈1 小时前
Go 1.25 发布:性能、工具与生态的全面进化
开发语言·后端·golang
郁大锤1 小时前
OpenAI responses使用教程(三) ——Responses create python SDK 介绍
人工智能·python·ai·openai
@syh.1 小时前
【C++】map和set
开发语言·c++
拾光Ծ1 小时前
C++11实用的“新特性”:列表初始化+右值引用与偷懒艺术——移动语义
开发语言·c++
何憶树之長青1 小时前
Kernel
开发语言·php
hardmenstudent1 小时前
Python字典--第1关:元组使用:这份菜单能修改吗?
开发语言·python