Python ElementTree 导出 xml 缺少 开头声明&【Pymssql】使用cursor.fetchall()获取执行结果时中文乱码

python 在调用ElementTree的write方法写入xml时,参数里增加 encoding='utf-8' 以及 xml_declaration=True

python 复制代码
et_root.write('filename.xml', encoding='utf-8', xml_declaration=True)

中文乱码问题:

Python的pymssql库连接SQL Sever,执行查询语句后,利用cursor.fetchall()方法获取执行结果的时候出现中文乱码,就像这样:

python 复制代码
cursor.execute("select * from director where dno = '" + self.no.get()+"'")  
data = cursor.fetchall()

结果:

汉字部分出现乱码,如图

('1111111111', 'Áõ¿¡ ', 20, 'ÄÐ ', '>>úе2203 ', '1', '1111111111 ')

出现中文乱码的原因可能是由于数据库中存储的字符集与Python解释器所使用的字符集不一致导致的。可以在连接数据库时,通过指定字符集来解决这个问题。

我之前设置的是charset="utf8",但仍然出现乱码,查完资料后改成了charset="cp936",就没有了乱码,具体如下:

原来连接数据库的语句:

python 复制代码
conn = pymssql.connect(host="localhost", port="1433", user=self.user, password=self.password,charset="utf8")

修改后:

python 复制代码
conn = pymssql.connect(host="localhost", port="1433", user=self.user, password=self.password,charset="cp936")

再运行就会发现已无乱码。

拓展

数据库中存储的字符集是指用于表示和存储数据的一种编码方式。不同的字符集可以支持不同的语言和字符,例如UTF-8字符集可以支持中文、日文、韩文等亚洲语言,而ASCII字符集则只能支持英文字母和数字等字符。

CP936是一种中文字符集编码,也称为GBK编码。它是由中国国家标准委员会制定的一种汉字编码标准,用于将汉字转换为计算机能够识别的二进制代码。CP936编码支持简体中文、繁体中文和日文等多种语言,并且可以表示超过70,000个汉字和50,000个汉字拼音。

在Windows操作系统中,默认使用CP936编码来处理文本文件,因此如果你在Windows下编写或编辑文本文件时,需要确保文件的编码格式为CP936。

原文链接:https://blog.csdn.net/U202113837/article/details/131467728

相关推荐
三体世界2 小时前
测试用例全解析:从入门到精通(1)
linux·c语言·c++·python·功能测试·测试用例·测试覆盖率
Python私教2 小时前
Django全栈班v1.04 Python基础语法 20250912 下午
后端·python·django
xchenhao2 小时前
Scikit-Learn 对糖尿病数据集(回归任务)进行全面分析
python·机器学习·回归·数据集·scikit-learn·特征·svm
xchenhao2 小时前
Scikit-learn 对加州房价数据集(回归任务)进行全面分析
python·决策树·机器学习·回归·数据集·scikit-learn·knn
这里有鱼汤2 小时前
发现一个高性能回测框架,Python + Rust,比 backtrader 快 250 倍?小团队必备!
后端·python
☼←安于亥时→❦2 小时前
数据分析之Pandas入门小结
python·pandas
带娃的IT创业者2 小时前
《Python Web部署应知应会》No3:Flask网站的性能优化和实时监测深度实战
前端·python·flask
赴3352 小时前
图像拼接案例,抠图案例
人工智能·python·计算机视觉
TwoAI2 小时前
Scikit-learn 机器学习:构建、训练与评估预测模型
python·机器学习·scikit-learn
max5006003 小时前
OpenSTL PredRNNv2 模型复现与自定义数据集训练
开发语言·人工智能·python·深度学习·算法