文章目录
前言
在用户登录、接口调用、数据校验等场景中,后端需要对敏感信息进行加密,其中最基础的一类方式就是 MD5 信息摘要(Message Digest 5) 。
本文用最精简的语言,讲清 MD5 是什么、有什么性质、实际项目中怎么用。
定义概念 + 缩写
MD5 --- Message Digest Algorithm 5
由 RSA 提出,是一种 单向散列函数(Hash Function) ,对任意输入产生 128-bit(16 字节)摘要 ,通常以 32 位十六进制字符串表示。
核心作用:
- 存储密码(加密不可逆)
- 文件校验(防止篡改)
- 唯一标识符生成
重要特性:
- 输入相同 → 输出永远相同
- 输入不同 → 输出完全不同(雪崩效应)
- 不可逆 → 不能从 MD5 反推出明文
- 性能高、实现简单
性质
| 性质 | 说明 |
|---|---|
| 单向性 | 仅能从明文生成摘要,不能反向得到明文 |
| 高效性 | 对任意长度数据都可在极短时间计算出摘要 |
| 雪崩效应 | 输入只要改一位,输出会完全不同 |
| 固定长度 | 无论输入多大,结果都是 128 bit(32 个 hex 字符) |
| 弱碰撞风险 | 相同 MD5 的不同数据存在可能(现代密码学已不推荐存密码) |
实际项目中应使用 bcrypt、PBKDF2、Argon2,但在学习或 legacy 系统中 MD5 仍很常见。
使用步骤
这里分别用 Python / Matlab / C 演示如何对字符串进行 MD5 计算。
Python
py
import hashlib
text = "123456"
md5_value = hashlib.md5(text.encode()).hexdigest()
print(md5_value)
MATLAB
matlab
text = '123456';
md5_hash = DataHash(text, struct('Method','MD5'));
disp(md5_hash)
MATLAB 没有原生 MD5,需要使用 DataHash 或 Java 调用。
C
c
#include <stdio.h>
#include <openssl/md5.h>
int main() {
unsigned char digest[MD5_DIGEST_LENGTH];
const char* msg = "123456";
MD5((unsigned char*)msg, strlen(msg), digest);
for (int i = 0; i < MD5_DIGEST_LENGTH; i++)
printf("%02x", digest[i]);
return 0;
}
总结
-
MD5 是一种不可逆的摘要算法,常用于存储密码和数据校验。
-
因为其存在碰撞风险,在安全性要求高的系统中已经不推荐使用。
-
在许多教学项目(例如外卖系统、练习登录模块)中,MD5 仍非常常见且足够使用。
-
实际开发中建议:
- 至少加盐(salt)+ 多次迭代
- 或直接使用 bcrypt / PBKDF2 / Argon2
参考文献
1\] Rivest R. "The MD5 Message-Digest Algorithm", RFC 1321, 1992.