python如何判断中文是否一致

Python判断两个相等的中文字符串为false,将两个待比较的字符串都把unicode编码设为'utf-8'也不能解决问题,具体原因如下:

1、首先查看待比较两个字符串的编码格式 ,使用命令:

复制代码
import chardet
......
string_code = chardet.detect(string_word)

比较两个字符串的编码结果,如下图所示:

一个编码格式为'UTF-8-SIG',另一个编码格式为'utf-8',两个字符串的编码格式不同,所以比较的结果为不相等;

出现编码为'UTF-8-SIG'是因为文件在存储的时候以UTF-8格式编码保存,将文件以UTF-8无BOM格式编码存储,则读取出的数据编码格式自然变为'utf-8'。

2、文件以UTF-8无BOM格式编码重新存储,重新比较两个相等的字符串,返回值为True,即两个字符串相等。

相关推荐
千寻girling3 小时前
一份不可多得的 《 Django 》 零基础入门教程
后端·python·面试
databook7 小时前
探索视觉的边界:用 Manim 重现有趣的知觉错觉
python·动效
明月_清风8 小时前
Python 性能微观世界:列表推导式 vs for 循环
后端·python
明月_清风8 小时前
Python 性能翻身仗:从 O(n) 到 O(1) 的工程实践
后端·python
helloweilei1 天前
python 抽象基类
python
用户8356290780511 天前
Python 实现 PPT 转 HTML
后端·python
zone77391 天前
004:RAG 入门-LangChain读取PDF
后端·python·面试
zone77391 天前
005:RAG 入门-LangChain读取表格数据
后端·python·agent
树獭非懒2 天前
AI大模型小白手册|Embedding 与向量数据库
后端·python·llm
唐叔在学习2 天前
就算没有服务器,我照样能够同步数据
后端·python·程序员