技术栈

utf-8-bom

wenha
3 小时前
utf-8·.net·编码·utf-8-bom
踩坑记录:UTF-8、UTF-8-BOM 与 GB2312 读取的乱码真相在日常开发中,编码乱码是一个高频且容易让人困惑的问题,尤其是涉及 UTF-8、UTF-8-BOM 与 GB2312 这几种编码格式时,很容易出现“看似不合理”的现象。最近我就遇到了一个典型场景:脚本文件最初用 UTF-8 编码,程序中指定 GB2312 读取时显示乱码;但将脚本改为 UTF-8-BOM 编码后,依然用 GB2312 读取,却能正常显示——这背后其实是 Windows 系统编码兼容机制的“小玄机”,今天就把这个踩坑过程和底层逻辑整理出来,帮大家避开同类问题。
我是有底线的