CryptoJS.AES “Malformed UTF-8 data” Bug 排查

一、问题描述

这几天在开发快照功能升级,遇到了一个让人非常困惑的报错:

Error: Malformed UTF-8 data

这个报错是测试同学构造的一个断网的极端case中出现的,且定位在代码的 CryptoJS.AES 解密与字符串还原环节。起初我的第一反应是"是不是解密用错了密钥/输入密文格式不对"?于是尝试手动造各种错误输入,包括用乱七八糟的字符串、空密文、空密钥、短字符串等方式,结果 CryptoJS 通常只返回一个空串或者 parse 崩溃,始终无法亲手复现这个Malformed UTF-8 data异常

几番抓狂后,我跟gpt沟通,请它帮我头脑风暴,给出能触发这个报错的例子,尝试了几次后,我才真正意识到报错的本质:

  • Malformed UTF-8 data其实不是在AES.decrypt这一步抛出的,而是在WordArray 被转为字符串(.toString(CryptoJS.enc.Utf8))时触发的异常
  • 想要复现,并不是随便乱输密文就能做到,必须让"密文解密后返回了一段特殊的非法 UTF-8 字节流",而且内容非空,这样在还原字符串时就一定会踩雷。

下面的例子可以100%复现问题

js 复制代码
const forgeRandomWordArray = CryptoJS.lib.WordArray.create([0xc3, 0x28]);
console.log(forgeRandomWordArray.toString(CryptoJS.enc.Utf8)); // 这里必定抛出 Malformed UTF-8 data

代入实际业务,源头其实是分片机制出错,拼接了不同时间点的历史密文片段。具体来说,由于断网等异常,部分分片保存的是本次快照的新内容,部分分片仍然是上一次的旧内容,最终拼接出的密文其实混合了两次保存的数据。这样合成的密文虽然长度对,但结构已被破坏,导致解密后不是合法的 UTF-8 字符串,从而抛出异常。

二、解决方法

本次排查心得:

  1. 不要以为"解密失败"一定会抛异常,CryptoJS 大多数时候直接返回空串,对错误极其宽容。
  2. 只有在"密文解密结果非空且不是合法UTF-8"时,才会在.toString(CryptoJS.enc.Utf8)这一步报出Malformed UTF-8 data

实践层面:

  • 凡涉及到解密和字符串还原的代码,必须用try/catch保护,下游逻辑要对解密结果做容错和提示。
js 复制代码
let decryptedStr;
try {
  decryptedStr = CryptoJS.AES.decrypt(ciphertext, key).toString(CryptoJS.enc.Utf8);
} catch (e) {
  //日志记录、友好提示
  decryptedStr = '';
}

如果这篇博文帮到了你,就请给我点个赞吧(#.#)

相关推荐
mCell4 小时前
如何零成本搭建个人站点
前端·程序员·github
mCell5 小时前
为什么 Memo Code 先做 CLI:以及终端输入框到底有多难搞
前端·设计模式·agent
恋猫de小郭5 小时前
AI 在提高你工作效率的同时,也一直在增加你的疲惫和焦虑
前端·人工智能·ai编程
少云清6 小时前
【安全测试】2_客户端脚本安全测试 _XSS和CSRF
前端·xss·csrf
萧曵 丶6 小时前
Vue 中父子组件之间最常用的业务交互场景
javascript·vue.js·交互
银烛木6 小时前
黑马程序员前端h5+css3
前端·css·css3
m0_607076606 小时前
CSS3 转换,快手前端面试经验,隔壁都馋哭了
前端·面试·css3
听海边涛声6 小时前
CSS3 图片模糊处理
前端·css·css3
IT、木易6 小时前
css3 backdrop-filter 在移动端 Safari 上导致渲染性能急剧下降的优化方案有哪些?
前端·css3·safari
0思必得06 小时前
[Web自动化] Selenium无头模式
前端·爬虫·selenium·自动化·web自动化