关于使用Visual Studio编译时产生的编码问题与解决方案

在使用Visual Studio 2026(下简称VS)进行编程的过程中,可能会出现如下的问题。

问题描述

例:程序中有:

c 复制代码
printf("中文提示信息");

在编译后正常,但是在读取由UTF编码的文件时,会出现乱码,如:

html 复制代码
滚滚长江东逝水

会变成:

html 复制代码
锘?/ 婊氭粴闀挎睙涓滈€濇按锛屾氮鑺辨窐灏借嫳闆勩€  //第一种乱码

而按照网上的教程,设定chcp 65001*(让控制台改用UTF-8编码显示文字)*后,则会出现:

html 复制代码
������ // 第二种乱码

问题分析

首先,Windows默认的编码形式为GBK(汉字内码扩展规范,代码页936)。它本质上是一个区域性字符集解决方案。‌‌而UTF-8(代码页65001)是Unicode字符集的一种可变长度编码实现方式,旨在统一表示全球所有语言的字符。它与ASCII编码完全兼容,已成为电子邮件、网页及跨平台应用中的主流编码。‌因此,UTF-8是现代应用开发、跨平台及国际化项目的首选编码,我们在编写程序的时候也应当使用UTF-8编码。

VS的默认编码是UTF-8,但是进行编译的结果以及调试时的命令行窗口默认使用的都是GBK编码 。这就导致了第一种情况:在调试时的窗口以及cmd中,中文提示信息都能显示正常,但在面对UTF-8的文本时,cmd就会出现第一种乱码,即**"古文码"。这是以GBK方式读取UTF-8编码的中文所产生的现象。这时我们可以使用chcp 65001来解决第一种乱码,但中文提示信息就会变成第二种乱码,即 "口字码"**。

对于以下几个体系,有:

  1. Windows 系统与控制台:默认使用GBK 编码(代码页 936),控制台的输入、输出均按 GBK 解析字节流;
  2. VS 文件保存与编译:VS 默认将源码文件保存为UTF-8 无签名(无 BOM)格式,但编译器默认按系统编码(GBK)解析源码,导致源码中的中文字符串被编译器按 GBK 解析为错误的字节流;
  3. UTF-8 文件读取:程序读取 UTF-8 编码文件时,得到的是 UTF-8 格式的字节流,若直接输出到 GBK 编码的控制台,字节流解析错误就会产生乱码。

下面给出我尝试过的几种解决办法以及其无法解决问题的原因。

  1. 使用setlocale(LC_ALL, ".UTF-8");(需要<locale.h>),这个方法无效的原因是该函数未配置 VS 编译参数时单独使用无效,但配合/utf-8编译参数后,能正常设置 C 标准库的本地化编码,让printf等函数正确输出 UTF-8 中文,所以会重复问题的情况;
  2. 使用SetConsoleOutputCP(65001);(需要<Windows.h>) ,这个方法来自Microsoft Learn的官方网站。原问题的链接在此。提问者和回答者讨论了与之类似的"system("chcp 65001");"。以及powershell的适配问题。这个方法无效的原因是:该函数本身能正常修改控制台输出编码为 UTF-8,单独使用乱码的原因是源码未按 UTF-8 编译(编译器仍按 GBK 解析 UTF-8 源码,导致字符串编码错误)
  3. 方法一和方法二同时使用。导致程序在cmd上无反应。暂不清楚其成因,推测是CMD 的 UTF-8 解析规则触发了输出缓冲区阻塞。
  4. 在Windows设置中的"更改系统区域设置"中勾选**"Beta版:使用Unicode UTF-8提供全球语言支持"**。这会引发一些未知的新问题。

解决方法

  1. 先在VS的解决方案资源管理器中右键工程名,找到"属性"。

  2. 在"属性"中找到**"配置属性"------"C/C++"------"命令行"**,并在"其他选项"中输入/utf-8,该参数的作用是让编译器按 UTF-8 解析源码(来源见此)。

  3. 在程序内使用SetConsoleOutputCP(65001);。这会使得调试命令行窗口也使用UTF-8编码。

  4. 在**"工具"------"选项"------"环境"------"文档"内,勾选"使用特定编码保存文件","保存编码"选择"Unicode(UTF-8带签名)"**。

    带签名的UTF-8编码可以使编译器自动识别UTF-8编码。

此外,还可以改变记事本存储文本的编码。只需要选择**"文件"------"另存为"**即可选择编码。

相关推荐
AD钙奶-lalala15 小时前
Android Studio新建项目默认不使用Compose模版
android·ide·android studio
MartinYeung516 小时前
[论文学习]基于梯度迭代上下文优化的 LLM 隐私越狱攻击框架
学习·区块链
MartinYeung516 小时前
[论文学习]大型语言模型中 PII 洩漏的系统性调查
学习
ss27317 小时前
【入门OJ题解】分苹果问题(Python/Java/C 实现)
java·c语言·python
你怎么知道我是队长17 小时前
CRC校验C语言实现-CRC8、CRC16、CRC16的直接计算法、查表法
c语言·前端·javascript
淘源码d17 小时前
医院专业级PACS系统完整源码(C+VC+MSSQL)
c语言·数据库·sqlserver·源码·pacs系统·医学影像系统
.千余17 小时前
【C++】C++手写Vector容器:从底层源码模拟实现
开发语言·c++·经验分享·笔记·学习
LONGZETECH18 小时前
汽车仿真教学软件技术实现深度解析:从三维建模到学情数据闭环
c语言·3d·unity·架构·汽车
nashane18 小时前
HarmonyOS 6学习:句柄泄漏(Fd Leak)从“崩溃现场”到“代码行”的精准狙击指南
学习·华为·音视频·harmonyos
坚果派·白晓明18 小时前
[鸿蒙PC三方库移植适配] 使用 AtomCode + Skills 自动完成Protobuf鸿蒙化适配
c语言·c++·华为·harmonyos