Python爬虫乱码问题之encoding和apparent_encoding的区别

encoding是从http中的header中的charset字段中提取的编码方式,若header中没有charset字段则默认为ISO-8859-1编码模式,则无法解析中文,这是乱码的原因

apparent_encoding会从网页的内容中分析网页编码的方式,所以apparent_encoding比encoding更加准确。当网页出现乱码时可以把apparent_encoding的编码格式赋值给encoding。

相关推荐
麦麦大数据9 分钟前
求职推荐大数据可视化平台招聘系统 Vue+Flask python爬虫 前后端分离
vue.js·爬虫·python·信息可视化·flask·推荐算法·协同过滤
杨荧4 天前
基于Python的宠物服务管理系统 Python+Django+Vue.js
大数据·前端·vue.js·爬虫·python·信息可视化
上海云盾第一敬业销售5 天前
小程序被爬虫攻击,使用waf能防护吗?
爬虫·小程序
小小码农一只5 天前
Python 爬虫实战:玩转 Playwright 跨浏览器自动化(Chromium/Firefox/WebKit 全支持)
爬虫·python·自动化
weixin_443353316 天前
小红书帖子评论的nodejs爬虫脚本
前端·爬虫
TLuoQiu7 天前
小电视视频内容获取GUI工具
爬虫·python
麦麦大数据7 天前
F004 新闻可视化系统爬虫更新数据+ flask + mysql架构
爬虫·mysql·flask·可视化·新闻
python-行者7 天前
akamai鼠标轨迹
爬虫·python·计算机外设·akamai
NEUMaple8 天前
python爬虫(四)----requests
开发语言·爬虫·python
电商API_180079052478 天前
大规模调用淘宝商品详情 API 的分布式请求调度实践
服务器·数据库·分布式·爬虫