论文阅读:2024-NAACL Semstamp、2024-ACL (Findings) k-SemStamp

总目录 大模型安全相关研究:https://blog.csdn.net/WhiffeYF/article/details/142132328

Semstamp: A semantic watermark with paraphrastic robustness for text generation
https://aclanthology.org/2024.naacl-long.226/

k-SemStamp: A Clustering-Based Semantic Watermark for Detection of Machine-Generated Text
https://aclanthology.org/2024.findings-acl.98/

github:https://github.com/abehou/SemStamp

https://www.doubao.com/chat/2065458618013954

GitHub代码和对应论文均围绕基于水印的AI生成文本检测展开。

  • 论文核心内容:论文《SemStamp: A Semantic Watermark with Paraphrastic Robustness for Text Generation》提出SemStamp算法,旨在解决现有水印生成算法易受释义攻击的问题。该算法在句子语义表示上进行水印嵌入,利用局部敏感哈希(LSH)划分句子语义空间。在文本生成阶段,通过对比学习微调句子编码器,将候选句子映射到语义嵌入空间,经LSH哈希后,采用拒绝采样使生成句子落在水印有效区域;检测时,对生成文本中有效区域句子数量进行单比例z检验,判断文本是否为机器生成。同时,论文提出双词释义攻击方法,用于测试水印算法的鲁棒性。实验表明,SemStamp在多种释义器和领域上比之前的方法更鲁棒,且能更好地保持生成文本质量。
  • GitHub代码功能:该代码库为论文的实现提供支持,涵盖SemStamp和k-SemStamp两个算法。其中,SemStamp利用LSH划分高维嵌入空间,使生成文本的LSH哈希值符合伪随机控制序列,检测时分析输入句子的LSH哈希值并进行z检验判断文本是否带水印;k-SemStamp是SemStamp的变体,使用k-means聚类划分嵌入空间,生成和检测过程与SemStamp类似 。代码库提供了详细的安装指南和使用示例,包括数据加载、模型微调、文本生成、释义和检测等步骤,方便使用者复现论文实验结果和进行自定义文本生成与检测。
相关推荐
张较瘦_1 天前
[论文阅读] AI + 软件工程 | LLM救场Serverless开发!SlsReuse框架让函数复用率飙升至91%,还快了44%
论文阅读·人工智能·软件工程
m0_650108241 天前
InstructBLIP:面向通用视觉语言模型的指令微调技术解析
论文阅读·人工智能·q-former·指令微调的视觉语言大模型·零样本跨任务泛化·通用视觉语言模型
做cv的小昊1 天前
VLM经典论文阅读:【综述】An Introduction to Vision-Language Modeling
论文阅读·人工智能·计算机视觉·语言模型·自然语言处理·bert·transformer
m0_650108242 天前
PaLM-E:具身智能的多模态语言模型新范式
论文阅读·人工智能·机器人·具身智能·多模态大语言模型·palm-e·大模型驱动
m0_650108243 天前
PaLM:Pathways 驱动的大规模语言模型 scaling 实践
论文阅读·人工智能·palm·谷歌大模型·大规模语言模型·全面评估与行为分析·scaling效应
小殊小殊3 天前
【论文笔记】视频RAG-Vgent:基于图结构的视频检索推理框架
论文阅读·人工智能·深度学习
有点不太正常3 天前
《ShadowCoT: Cognitive Hijacking for Stealthy Reasoning Backdoors in LLMs》——论文阅读
论文阅读·大模型·agent安全
小殊小殊3 天前
【论文笔记】大型语言模型的知识蒸馏与数据集蒸馏
论文阅读·人工智能·深度学习
SatoshiGogo4 天前
AIGC 论文笔记
论文阅读·aigc
walnut_oyb5 天前
arXiv|SARLANG-1M:用于 SAR 图像理解的视觉-语言建模基准
论文阅读·人工智能·机器学习·计算机视觉·语言模型·自然语言处理