Python爬网页,不确定网页的编码,不需要用第三方库

Python爬网页,不确定网页的编码,不需要用第三方库,自己写个判断,乱拳打死老师傅

detect试了,不好用

apparent_encoding试了,不好用

encoding试了,不好用

headers里get试了,不好用

最后用下面这个方法,反而是最好用的,也不是100%准确,但是在我用的过程中,这个是最好用的,反正也没有100%的,还不如用自己写的函数呢

python 复制代码
def detect_encoding(byte_text):  
    encodings_to_try = ['utf-8', 'gbk', 'gb2312', 'gb18030', 'ascii', 'latin1']  
    for encoding in encodings_to_try:  
        try:  
            return encoding  
        except UnicodeDecodeError:  
            continue  
    return None
相关推荐
沐知全栈开发2 分钟前
R 绘图 - 饼图
开发语言
charlie1145141913 分钟前
嵌入式C++开发——RAII 在驱动 / 外设管理中的应用
开发语言·c++·笔记·嵌入式开发·工程实践
Fcy6483 分钟前
C++11 新增特性(中)
开发语言·c++·c++11·可变参数模版·c++11 类的新增功能·c++11slt新增特性
小码过河.5 分钟前
17装饰器模式
开发语言·python·装饰器模式
gf132111113 分钟前
python_生成RPA运行数据报告
windows·python·rpa
嫂子开门我是_我哥14 分钟前
第八节:条件判断与循环:解锁Python的逻辑控制能力
开发语言·python
java1234_小锋14 分钟前
什么是Java可重入锁?
java·开发语言
小尧嵌入式15 分钟前
【Linux开发五】条件变量|信号量|生产者消费者模型|信号概念和常见信号|信号的使用和处理
linux·运维·服务器·开发语言·c++·嵌入式硬件
不会c+16 分钟前
Spring详解(二)IOC控制反转
java·开发语言
翔云12345616 分钟前
golang中使用 sort.Interface 实现复杂多级排序
开发语言·后端·golang