关于使用Visual Studio编译时产生的编码问题与解决方案

在使用Visual Studio 2026（下简称VS）进行编程的过程中，可能会出现如下的问题。

问题描述

例：程序中有：
c 复制代码
printf("中文提示信息");
在编译后正常，但是在读取由UTF编码的文件时，会出现乱码，如:
html 复制代码
滚滚长江东逝水
会变成：
html 复制代码
锘?/ 婊氭粴闀挎睙涓滈€濇按锛屾氮鑺辨窐灏借嫳闆勩€  //第一种乱码
而按照网上的教程，设定chcp 65001*（让控制台改用UTF-8编码显示文字）*后，则会出现：
html 复制代码
������ // 第二种乱码

问题分析

首先，Windows默认的编码形式为GBK（汉字内码扩展规范，代码页936）。它本质上是一个区域性字符集解决方案。‌‌而UTF-8（代码页65001）是Unicode字符集的一种可变长度编码实现方式，旨在统一表示全球所有语言的字符。它与ASCII编码完全兼容，已成为电子邮件、网页及跨平台应用中的主流编码。‌因此，UTF-8是现代应用开发、跨平台及国际化项目的首选编码，我们在编写程序的时候也应当使用UTF-8编码。

VS的默认编码是UTF-8，但是进行编译的结果以及调试时的命令行窗口默认使用的都是GBK编码 。这就导致了第一种情况：在调试时的窗口以及cmd中，中文提示信息都能显示正常，但在面对UTF-8的文本时，cmd就会出现第一种乱码，即**"古文码"。这是以GBK方式读取UTF-8编码的中文所产生的现象。这时我们可以使用chcp 65001来解决第一种乱码，但中文提示信息就会变成第二种乱码，即 "口字码"**。

对于以下几个体系，有：

Windows 系统与控制台：默认使用GBK 编码（代码页 936），控制台的输入、输出均按 GBK 解析字节流；
VS 文件保存与编译：VS 默认将源码文件保存为UTF-8 无签名（无 BOM）格式，但编译器默认按系统编码（GBK）解析源码，导致源码中的中文字符串被编译器按 GBK 解析为错误的字节流；
UTF-8 文件读取：程序读取 UTF-8 编码文件时，得到的是 UTF-8 格式的字节流，若直接输出到 GBK 编码的控制台，字节流解析错误就会产生乱码。

下面给出我尝试过的几种解决办法以及其无法解决问题的原因。

使用setlocale(LC_ALL, ".UTF-8");（需要<locale.h>），这个方法无效的原因是该函数未配置 VS 编译参数时单独使用无效，但配合/utf-8编译参数后，能正常设置 C 标准库的本地化编码，让printf等函数正确输出 UTF-8 中文，所以会重复问题的情况；
使用SetConsoleOutputCP(65001);（需要<Windows.h>） ，这个方法来自Microsoft Learn的官方网站。原问题的链接在此。提问者和回答者讨论了与之类似的"system("chcp 65001");"。以及powershell的适配问题。这个方法无效的原因是：该函数本身能正常修改控制台输出编码为 UTF-8，单独使用乱码的原因是源码未按 UTF-8 编译（编译器仍按 GBK 解析 UTF-8 源码，导致字符串编码错误）
方法一和方法二同时使用。导致程序在cmd上无反应。暂不清楚其成因，推测是CMD 的 UTF-8 解析规则触发了输出缓冲区阻塞。
在Windows设置中的"更改系统区域设置"中勾选**"Beta版：使用Unicode UTF-8提供全球语言支持"**。这会引发一些未知的新问题。

解决方法

先在VS的解决方案资源管理器中右键工程名，找到"属性"。
在"属性"中找到**"配置属性"------"C/C++"------"命令行"**，并在"其他选项"中输入/utf-8，该参数的作用是让编译器按 UTF-8 解析源码（来源见此）。
在程序内使用SetConsoleOutputCP(65001);。这会使得调试命令行窗口也使用UTF-8编码。
在**"工具"------"选项"------"环境"------"文档"内，勾选"使用特定编码保存文件"，"保存编码"选择"Unicode（UTF-8带签名）"**。

带签名的UTF-8编码可以使编译器自动识别UTF-8编码。

此外，还可以改变记事本存储文本的编码。只需要选择**"文件"------"另存为"**即可选择编码。