csv文件EXCEL默认打开乱码问题

这里讨论的问题是,当用记事本打开带有中文字符的csv正常时,用excel打开却是乱码。

简单概括就是:编码问题,windows的 excel打开csv文本文件时,默认使用的是系统内的ANSI,在中文环境下就是GB2312。如果写文件时,用的编码格式是UTF-8那么excel用GB2312打开肯定是乱码。

一般两种方法,在文件创建时指定让Excel默认打开不乱码的编码,或者加BOM 标记(Byte Order Mark 字节顺序标记),让excel用指定的编码打开。

所以解决的思路就很清晰:

1.使用GB2312,gbk,gb18030这类windows下中文默认的编码。

2.使用utf-8-sig即在文件头写入 0xEF、0xBB、0xBF,让excel识别出这是utf-8编码,用utf-8编码打开csv文件。

实例:

python 写csv文件时指定编码格式,如gb2312 ,gbk ,gb18030 ,python的csv包不需要再文件头写入0xEF、0xBB、0xBF,直接指定utf-8-sig就可以。

with open('file.csv', 'w', newline='', encoding='gb18030', mode='wb') as file:  
    writer = csv.writer(file)  
    # 写入数据到CSV文件

如果是数据流返回,可以指定编码格式

"Content-Type": "application/octet-stream; charset=utf-8-sig"

写入utf-bom的csv

没有bom的utf

go 在文件头写入 BOM

func generateCSV(data [][]string) []byte {
	var buffer bytes.Buffer
	writer := csv.NewWriter(&buffer)
	for index, row := range data {
		if index == 0 {
			if len(row) > 0 {
				// 写入 UTF-8 BOM让excel自己识别csv
				row[0] = "\xEF\xBB\xBF" + row[0]
			}
		}
		writer.Write(row)
	}

	writer.Flush()
	return buffer.Bytes()
}

参考:

Windows 记事本的 ANSI、Unicode、UTF-8 这三种编码模式有什么区别? - 知乎

ASCII、GB2312、GBK、GB18030、Unicode、UTF-8、BIG5 编码分析_gb18030和gbk-CSDN博客

csv 文件打开乱码,有哪些方法可以解决? - 知乎

encoding - Microsoft Excel mangles Diacritics in .csv files? - Stack Overflow

相关推荐
AIAdvocate20 分钟前
Pandas_数据结构详解
数据结构·python·pandas
小言从不摸鱼22 分钟前
【AI大模型】ChatGPT模型原理介绍(下)
人工智能·python·深度学习·机器学习·自然语言处理·chatgpt
FreakStudio2 小时前
全网最适合入门的面向对象编程教程:50 Python函数方法与接口-接口和抽象基类
python·嵌入式·面向对象·电子diy
redcocal4 小时前
地平线秋招
python·嵌入式硬件·算法·fpga开发·求职招聘
artificiali4 小时前
Anaconda配置pytorch的基本操作
人工智能·pytorch·python
RaidenQ4 小时前
2024.9.13 Python与图像处理新国大EE5731课程大作业,索贝尔算子计算边缘,高斯核模糊边缘,Haar小波计算边缘
图像处理·python·算法·课程设计
花生了什么树~.5 小时前
python基础知识(六)--字典遍历、公共运算符、公共方法、函数、变量分类、参数分类、拆包、引用
开发语言·python
Trouvaille ~5 小时前
【Python篇】深度探索NumPy(下篇):从科学计算到机器学习的高效实战技巧
图像处理·python·机器学习·numpy·信号处理·时间序列分析·科学计算
爆更小小刘5 小时前
Python基础语法(3)下
开发语言·python
哪 吒5 小时前
华为OD机试 - 第 K 个字母在原来字符串的索引(Python/JS/C/C++ 2024 E卷 100分)
javascript·python·华为od