Windows下Qt使用MSVC编译出现需要转为unicode的提示

参考 Qt5中文编码问题解决办法_qt5设置编码-CSDN博客 致敬

提示:warning: C4819: 该文件包含不能在当前代码页(936)中表示的字符。请将该文件保存为 Unicode 格式以防止数据丢失。

出现此问题,应该是Unix格式下代码的编码格式是UTF-8,注意不是UTF-8-BOM。Unix和WIndows的编译器对文档格式的处理方式差异造成的。说白了,其实就是"微软"出品的会把UTF-8 无BOM格式当为GBK处理,也就是不认识UTF-8编码,但能处理GBK和UTF-8-BOM格式。标准上其实没有所谓的UTF-8-BOM,只是微软这样区分了,反而是不支持真正的UTF-8编码格式了。

MSVC和GCC在默认处理编码字符集和执行字符集时有差异,导致相同的代码在不同编译器下可能会出现乱码。

只要在不同的编译器下,源码字符集、执行字符集都统一为UTF-8,就能解决乱码的问题。

1、MSVC

MSVC的编码字符集和执行字符集默认都是GBK,想把MSVC的编码字符集和执行字符集都修改为UTF-8,并不容易。

1.1、源码字符集

默认情况下,MSVC编译时,只有"UFT-8 with BOM"格式的文件会被认为是UTF-8,而"UTF-8 without BOM"和其他格式都会被认为是GBK。

对于MSVC2015以后的版本,如果源文件是UTF-8 without BOM,不是UFT-8 with BOM,还想让MSVC把源码当做UTF-8处理,可以专门告诉编译器源码文件是UTF-8格式,编译时增加命令"/source-charset:utf-8"。

对于MSVC2015之前的版本,这个命令不一定生效,源文件保存成UTF-8 without BOM格式就会出问题,需要注意。

1.2、执行字符集

默认情况下,MSVC在编译时,无论cpp文件源码字符集是UTF-8 without BOM、UTF-8 with BOM、GBK 中的哪一种,只要没有告诉编译器执行码字符集是UFT-8,则最终在内存中,都会被强制转换GBK处理。

想让MSVC执行字符集为UTF-8,必须对源文件增加执行字符集的声明或编译时增加命令。

声明的方式是在每个源码文件的开头增加该内容:#pragma execution_character_set("utf-8")。

编译时增加的命令是"/execution-charset:utf-8"。

而本人所涉及的项目中文件的编码格式各种各样,GBK、ANSI、UTF-8、UTF-8-BOM都有,为了统一,采用了统一转为UTF-8-BOM的方式在Windows下编译了,应该转成GBK也行。

因为涉及的文件很多,需要批量转,于是研究了转换方法:参考 Notepad++批量更改文件编码格式及文档格式-CSDN博客

本人也试过在Qt的.pro中加入msvc:QMAKE_CXXFLAGS += /utf-8编译选项,但因为文件格式不统一,加了这个会导致GBK格式的文件编译后出现中文乱码的问题了。

相关推荐
长河27 分钟前
Java开发者LLM实战——LangChain4j最新版教学知识库实战
java·开发语言
Cyan_RA937 分钟前
SpringMVC @RequestMapping的使用演示和细节 详解
java·开发语言·后端·spring·mvc·ssm·springmvc
再见晴天*_*4 小时前
SpringBoot 中单独一个类中运行main方法报错:找不到或无法加载主类
java·开发语言·intellij idea
lqjun08275 小时前
Qt程序单独运行报错问题
开发语言·qt
hdsoft_huge7 小时前
Java & Spring Boot常见异常全解析:原因、危害、处理与防范
java·开发语言·spring boot
风中的微尘7 小时前
39.网络流入门
开发语言·网络·c++·算法
未来之窗软件服务8 小时前
幽冥大陆(二)RDIFSDK 接口文档:布草洗涤厂高效运营的技术桥梁C#—东方仙盟
开发语言·c#·rdif·仙盟创梦ide·东方仙盟
小冯记录编程8 小时前
C++指针陷阱:高效背后的致命危险
开发语言·c++·visual studio
1uther8 小时前
Unity核心概念⑨:Screen
开发语言·游戏·unity·c#·游戏引擎
C_Liu_9 小时前
C++:类和对象(下)
开发语言·c++