在 Android 上用上原生的 xxHash,性能直接拉满

哈希计算在日常开发中太常见了------数据校验、缓存 key 生成、文件去重,哪哪都离不开。提到哈希,大家第一反应可能是 MD5 或者 SHA,但如果你只需要快速生成一个指纹,不需要密码学安全性,那 xxHash 绝对是更好的选择。

问题是,Android 上好用的 xxHash 库不太好找。纯 Java 实现的性能跟 C 原版差了好几倍,而现有的 JNI 封装要么年久失修,要么不支持 Android 15 的 16KB 页面大小对齐。

所以我自己造了个轮子。

不说废话

fast-xxhash-android 直接编译 xxHash 的 C 源码,通过 JNI 暴露给上层,支持 XXH32、XXH64、XXH3-64、XXH3-128 四种算法,覆盖 armeabi-v7a、arm64-v8a、x86、x86_64 四个架构。

引入一行搞定:

kotlin 复制代码
implementation("io.github.limuyang2:xxhash:<version>")

用起来也简单:

kotlin 复制代码
// Kotlin 扩展函数,直接调
val hash = "Hello, World!".xxh64()

// Java 也行
long hash = XXHash.xxh64(data, 0);

为什么不用纯 Java 实现?

xxHash 官方给出的速度数据是这样的:

算法 速度
XXH3-64 31.5 GB/s
XXH64 19.3 GB/s
XXH32 9.8 GB/s
MD5 0.65 GB/s
SHA-256 0.42 GB/s

XXH3 比 MD5 快了将近 50 倍

但这个数据是 C 原版的。换成纯 Java 实现,性能会打折扣------JVM 的数组访问有边界检查,SIMD 指令也没法直接用,大块数据计算的时候差距更明显。尤其 Android 设备性能参差不齐,中低端机上这个差距会被放大。

直接编译 C 源码走 JNI 是最靠谱的方案,调用开销在微秒级别,可以忽略不计。

16KB Page Size 的事

Android 15 开始支持 16KB 页面大小,部分新设备(比如 Pixel 9 系列)已经默认开启了。如果你的 native 库没有做 16KB 对齐,在这些设备上可能会出问题。

这个问题很多老库都没适配,本库已经处理好了,SO 文件构建时就做了对齐,不用担心兼容性。

怎么用

Kotlin

StringByteArrayByteBuffer 都提供了扩展函数:

kotlin 复制代码
import io.github.limuyang2.xxhash.lib.*

// 字符串直接算
val h64 = "Hello, World!".xxh64()

// 带 seed
val h64s = "Hello, World!".xxh64(seed = 42)

// ByteArray 也行
val data = "some data".toByteArray()
data.xxh32()
data.xxh3As128()  // 返回 LongArray[2],128 位

// 只算数组的一部分,不用拷贝
data.xxh32(offset = 7, length = 6)

// ByteBuffer 也可以,不会动 position
val buffer = ByteBuffer.wrap(data)
buffer.xxh64()

Java

Java 就用静态方法,@JvmStatic 注解都加好了:

java 复制代码
import io.github.limuyang2.xxhash.lib.XXHash;

byte[] data = "Hello, World!".getBytes();

long h32 = XXHash.xxh32(data, 0);
long h64 = XXHash.xxh64(data, 0);
long h3 = XXHash.xxh3_64bits(data);
long[] h128 = XXHash.xxh3_128bits(data);

// 数组切片
long hash = XXHash.xxh32Bytes(full, 7, 6, 0);

支持的算法

算法 说明 返回值
XXH32 经典 32 位哈希,兼容性好 Long
XXH64 64 位哈希,速度和分布更优 Long
XXH3-64 最新一代,速度最快 Long
XXH3-128 128 位哈希,碰撞概率极低 LongArray[2]

日常用 xxh64() 就够了,追求极致速度选 xxh3As64(),对碰撞敏感的场景用 xxh3As128()

实现细节

不多说,核心就三层:

  1. C 层 --- 直接用的 xxHash v0.8.3 官方源码,-O3 编译,静态链接进 libmuxxhash.so
  2. JNI 层 --- 薄薄一层桥接代码,拿到 jbyteArray 指针直接丢给 xxHash 算完返回
  3. Kotlin 层 --- object 单例 + @JvmStatic + 扩展函数

没有多余的依赖,SO 文件也很小。

最后

感兴趣的可以看看源码,实现很简洁:

有问题欢迎提 issue。

相关推荐
赏金术士8 小时前
Kotlin 习题集 · 高级篇
android·开发语言·kotlin
问心无愧051310 小时前
ctf show web 入门42
android·前端·android studio
没什么本事11 小时前
关于C# panel 添加lable问题 -- 明确X和Y 位置错误
android·java·c#
REDcker14 小时前
Android HWASan 详解:硬件标记原理、Clang 启用与排障实践
android·linux·debug·编译·clang·asan·hwasan
2501_9159090615 小时前
全面解析前端开发中常用的浏览器调试工具及其使用场景
android·ios·小程序·https·uni-app·iphone·webview
angerdream15 小时前
Android手把手编写儿童手机远程监控App之SQLite详解2
android
-SOLO-15 小时前
Python 爬取小红书 文章标题和内容 仅供学习
android·python·学习
ooseabiscuit15 小时前
Laravel5
android·php·laravel
科技道人16 小时前
Android 禁止使用ipv6 测试
android·禁用ipv6
AlexMaybeBot16 小时前
巧用 OpenClaw 为 Android 开发电脑瘦身
android·github·ai编程