CryptoJS.AES “Malformed UTF-8 data” Bug 排查

一、问题描述

这几天在开发快照功能升级,遇到了一个让人非常困惑的报错:

Error: Malformed UTF-8 data

这个报错是测试同学构造的一个断网的极端case中出现的,且定位在代码的 CryptoJS.AES 解密与字符串还原环节。起初我的第一反应是"是不是解密用错了密钥/输入密文格式不对"?于是尝试手动造各种错误输入,包括用乱七八糟的字符串、空密文、空密钥、短字符串等方式,结果 CryptoJS 通常只返回一个空串或者 parse 崩溃,始终无法亲手复现这个Malformed UTF-8 data异常

几番抓狂后,我跟gpt沟通,请它帮我头脑风暴,给出能触发这个报错的例子,尝试了几次后,我才真正意识到报错的本质:

  • Malformed UTF-8 data其实不是在AES.decrypt这一步抛出的,而是在WordArray 被转为字符串(.toString(CryptoJS.enc.Utf8))时触发的异常
  • 想要复现,并不是随便乱输密文就能做到,必须让"密文解密后返回了一段特殊的非法 UTF-8 字节流",而且内容非空,这样在还原字符串时就一定会踩雷。

下面的例子可以100%复现问题

js 复制代码
const forgeRandomWordArray = CryptoJS.lib.WordArray.create([0xc3, 0x28]);
console.log(forgeRandomWordArray.toString(CryptoJS.enc.Utf8)); // 这里必定抛出 Malformed UTF-8 data

代入实际业务,源头其实是分片机制出错,拼接了不同时间点的历史密文片段。具体来说,由于断网等异常,部分分片保存的是本次快照的新内容,部分分片仍然是上一次的旧内容,最终拼接出的密文其实混合了两次保存的数据。这样合成的密文虽然长度对,但结构已被破坏,导致解密后不是合法的 UTF-8 字符串,从而抛出异常。

二、解决方法

本次排查心得:

  1. 不要以为"解密失败"一定会抛异常,CryptoJS 大多数时候直接返回空串,对错误极其宽容。
  2. 只有在"密文解密结果非空且不是合法UTF-8"时,才会在.toString(CryptoJS.enc.Utf8)这一步报出Malformed UTF-8 data

实践层面:

  • 凡涉及到解密和字符串还原的代码,必须用try/catch保护,下游逻辑要对解密结果做容错和提示。
js 复制代码
let decryptedStr;
try {
  decryptedStr = CryptoJS.AES.decrypt(ciphertext, key).toString(CryptoJS.enc.Utf8);
} catch (e) {
  //日志记录、友好提示
  decryptedStr = '';
}

如果这篇博文帮到了你,就请给我点个赞吧(#.#)

相关推荐
修己xj3 小时前
告别手动存图!这款叫 Fatkun 的浏览器插件,简直是素材收集神器
前端
袋鼠云数栈4 小时前
从前端到基础设施,ACOS 如何打通企业全链路可观测
运维·前端·人工智能·数据治理·数据智能
AskHarries4 小时前
系统提示词、开发者指令和用户输入的优先级
java·前端·数据库
Moment4 小时前
长上下文会最终杀死 Rag 吗?
前端·javascript·后端
qcx235 小时前
【系统学AI】25 论文导读 ①:两篇改变 AI 的开山之作——Attention Is All You Need & ReAct
前端·人工智能·react.js·transformer
kyriewen5 小时前
大文件上传最全指南:分片、断点续传、秒传,一篇就够了
前端·javascript·面试
我叫黑大帅6 小时前
解决聊天页内部滚轮改为页面滚动问题
javascript·后端·面试
郑洁文6 小时前
基于Python的Web命令执行漏洞自动化检测系统
前端·python·网络安全·自动化
新酱爱学习6 小时前
手搓 10 个 Skill 后,我把重复劳动收敛成了一套零依赖 CLI 工具
前端·javascript·人工智能
罗超驿7 小时前
13.JavaScript 新手入门指南:语法、变量、流程控制全解析
开发语言·javascript