Python爬网页,不确定网页的编码,不需要用第三方库

Python爬网页,不确定网页的编码,不需要用第三方库,自己写个判断,乱拳打死老师傅

detect试了,不好用

apparent_encoding试了,不好用

encoding试了,不好用

headers里get试了,不好用

最后用下面这个方法,反而是最好用的,也不是100%准确,但是在我用的过程中,这个是最好用的,反正也没有100%的,还不如用自己写的函数呢

python 复制代码
def detect_encoding(byte_text):  
    encodings_to_try = ['utf-8', 'gbk', 'gb2312', 'gb18030', 'ascii', 'latin1']  
    for encoding in encodings_to_try:  
        try:  
            return encoding  
        except UnicodeDecodeError:  
            continue  
    return None
相关推荐
love530love25 分钟前
ComfyUI rgthree-comfy Image Comparer 节点无输出问题排查与解决
人工智能·windows·python·comfyui·rgthree-comfy·nodes 2.0·vue 节点
2401_8898846636 分钟前
高性能计算通信库
开发语言·c++·算法
badhope41 分钟前
Docker从零开始安装配置全攻略
运维·人工智能·vscode·python·docker·容器·github
用户0332126663671 小时前
使用 Python 复制 Excel 工作表
python
JaydenAI1 小时前
[LangChain之链]RunnableCallable——将“自由定义”的函数变成标准组件
python·langchain·ai编程
GinoWi1 小时前
Chapter 3 - Python列表
python
姚生1 小时前
Tushare全解析:金融量化分析的数据基石
大数据·python
Hi202402172 小时前
如何从互联网上免费下载歌曲
python·自动化
2401_898075122 小时前
Python在金融科技(FinTech)中的应用
jvm·数据库·python
老师好,我是刘同学2 小时前
选择排序原理与Python实现
python·排序算法