Windows下Qt使用MSVC编译出现需要转为unicode的提示

参考 Qt5中文编码问题解决办法_qt5设置编码-CSDN博客 致敬

提示:warning: C4819: 该文件包含不能在当前代码页(936)中表示的字符。请将该文件保存为 Unicode 格式以防止数据丢失。

出现此问题,应该是Unix格式下代码的编码格式是UTF-8,注意不是UTF-8-BOM。Unix和WIndows的编译器对文档格式的处理方式差异造成的。说白了,其实就是"微软"出品的会把UTF-8 无BOM格式当为GBK处理,也就是不认识UTF-8编码,但能处理GBK和UTF-8-BOM格式。标准上其实没有所谓的UTF-8-BOM,只是微软这样区分了,反而是不支持真正的UTF-8编码格式了。

MSVC和GCC在默认处理编码字符集和执行字符集时有差异,导致相同的代码在不同编译器下可能会出现乱码。

只要在不同的编译器下,源码字符集、执行字符集都统一为UTF-8,就能解决乱码的问题。

1、MSVC

MSVC的编码字符集和执行字符集默认都是GBK,想把MSVC的编码字符集和执行字符集都修改为UTF-8,并不容易。

1.1、源码字符集

默认情况下,MSVC编译时,只有"UFT-8 with BOM"格式的文件会被认为是UTF-8,而"UTF-8 without BOM"和其他格式都会被认为是GBK。

对于MSVC2015以后的版本,如果源文件是UTF-8 without BOM,不是UFT-8 with BOM,还想让MSVC把源码当做UTF-8处理,可以专门告诉编译器源码文件是UTF-8格式,编译时增加命令"/source-charset:utf-8"。

对于MSVC2015之前的版本,这个命令不一定生效,源文件保存成UTF-8 without BOM格式就会出问题,需要注意。

1.2、执行字符集

默认情况下,MSVC在编译时,无论cpp文件源码字符集是UTF-8 without BOM、UTF-8 with BOM、GBK 中的哪一种,只要没有告诉编译器执行码字符集是UFT-8,则最终在内存中,都会被强制转换GBK处理。

想让MSVC执行字符集为UTF-8,必须对源文件增加执行字符集的声明或编译时增加命令。

声明的方式是在每个源码文件的开头增加该内容:#pragma execution_character_set("utf-8")。

编译时增加的命令是"/execution-charset:utf-8"。

而本人所涉及的项目中文件的编码格式各种各样,GBK、ANSI、UTF-8、UTF-8-BOM都有,为了统一,采用了统一转为UTF-8-BOM的方式在Windows下编译了,应该转成GBK也行。

因为涉及的文件很多,需要批量转,于是研究了转换方法:参考 Notepad++批量更改文件编码格式及文档格式-CSDN博客

本人也试过在Qt的.pro中加入msvc:QMAKE_CXXFLAGS += /utf-8编译选项,但因为文件格式不统一,加了这个会导致GBK格式的文件编译后出现中文乱码的问题了。

相关推荐
2601_949146535 小时前
C语言语音通知接口接入教程:如何使用C语言直接调用语音预警API
c语言·开发语言
曹牧5 小时前
Spring Boot:如何测试Java Controller中的POST请求?
java·开发语言
KYGALYX5 小时前
服务异步通信
开发语言·后端·微服务·ruby
zmzb01035 小时前
C++课后习题训练记录Day98
开发语言·c++
猫头虎6 小时前
如何排查并解决项目启动时报错Error encountered while processing: java.io.IOException: closed 的问题
java·开发语言·jvm·spring boot·python·开源·maven
YUJIANYUE6 小时前
PHP纹路验证码
开发语言·php
仟濹6 小时前
【Java基础】多态 | 打卡day2
java·开发语言
孞㐑¥6 小时前
算法——BFS
开发语言·c++·经验分享·笔记·算法
Re.不晚6 小时前
JAVA进阶之路——无奖问答挑战2
java·开发语言
八零后琐话6 小时前
干货:程序员必备性能分析工具——Arthas火焰图
开发语言·python