[论文泛读]zkLLM: Zero Knowledge Proofs for Large Language models

文章目录

介绍

这篇文章发在CCS2024,CCS是密码学领域的顶会。作者是来自加拿大的University of Waterloo。文章对大语言模型像GPT和LLM等大语言模型实现了零知识可验证执行,但不涉及零知识可验证训练。个人觉得这是一篇值得精读的一篇文章。文章的方案与现存的RISC-ZERO和EZKL或者Halo2的方案(zkML)不同。文中使用完全并行化的 CUDA ,同时对于拥有 130 亿个参数的 LLM,这篇文章的方法能够在 15 分钟内为整个推理过程生成正确性证明。生成的证明大小不到 200 kB。(使用ezkl的方案使用nanoGPT参数大概40w实现零知识可验证执行所需要的时间2小时,而这篇论文的方案有着质的提升)。

实验数据

实验数据1

论文中分别对大语言模型进行证明生成的时间,证明大小以及验证时间进行了测量。

实验数据2

论文中与zkML的生成证明的时间进行了比较,zk LLM方案的生成证明的时间远远低于zkML生成证明的时间。zkML这个方案是基于halo2的方案。

实验数据3

该实验研究了Sequence Length对生成证明的时间,生成证明的大小,以及验证时间的影响。Sequence Length是模型输入文本的长度。

相关推荐
.又是新的一天.12 小时前
AI+软件测试04(AI应用技巧)
软件测试·人工智能·ai+软件测试
非ban必选12 小时前
DJL使用yolo11n目标检测
人工智能·目标检测·计算机视觉
裤裤兔12 小时前
CNN和RNN结合提升分类效果
人工智能·rnn·神经网络·分类·cnn·医学图像处理
IT_陈寒12 小时前
Vue3 性能优化实战:从10秒到1秒的5个关键技巧,让你的应用飞起来!
前端·人工智能·后端
还是大剑师兰特13 小时前
AI智慧农业20强
人工智能·思维导图·大剑师
永远都不秃头的程序员(互关)13 小时前
人工智能深度学习实战:手写数字识别指南
人工智能
天才少女爱迪生13 小时前
【算法设计】GLM-4.5V模型架构和算法设计详解
python·算法·语言模型
BJ_Bonree13 小时前
Bonree ONE 发布直通车| 如何利用核心链路,快速排查定位系统故障?
大数据·运维·人工智能
weixin_4462608513 小时前
八、微调后模型使用及效果验证-1
前端·人工智能·chrome·微调模型
ccLianLian13 小时前
CorrCLIP
人工智能·计算机视觉