Stealthy Attack on Large Language Model based Recommendation

传统RS依赖id信息进行推荐,攻击:生成虚假用户,这些用户对特定目标物体给于高评价,从而影响模型的训练。

基于llm的RS:llm利用语义理解,将用户兴趣转化为语义向量,通过计算用户兴趣向量与物品向量之间的相似度来进行推荐。

创新点

将LLM引入推荐系统 recommender systems (RS),存在潜在脆弱性:

攻击者可以在测试阶段改变目标项目的文本内容(标题、描述)来提高目标项目的曝光率,而不需要直接干扰模型的训练过程。攻击很隐蔽的,不会影响整体推荐性能。

如图,基于llm的RS模型的文本攻击范式。

修改目标物品的标题,误导RS模型对其进行更高的排名。修改微妙,整体推荐性能几乎没有变化。

方法

1.使用单词插入

预定义一个积极感叹词语料库。随机从语料库中挑选k个单词插入到原文内容的末尾,并保持整体的连贯性。提高目标被系统推荐的可能性。

2.利用(gpt)重写

利用GPT模型指导内容改写,生成与目标任务关联的多种改写版本,从中筛选出最符合攻击意图的结果。

文本攻击的主要组成部分

1.目标函数:用来评估最合适的文本扰动,作为搜索方法识别最优解的依据。

2.限制:确保扰动是原始输入的有效改变,强调语义保留和词性标签的一致性等方面。

3.转换:输入的扰动的过程,交换(同义词交换、词嵌入)。

4.搜索方法:迭代查询模型 ,选择转换产生的扰动,采用诸如具有单词重要性排序的贪婪方法,束搜索或遗传算法等技术。

相关推荐
阿正的梦工坊3 分钟前
Kaiming Uniform 初始化:神经网络权重初始化的优雅解决方案
人工智能·深度学习·神经网络
早点睡啊Y1 小时前
AI绘画笔记--基础知识
人工智能·ai作画
蹦蹦跳跳真可爱5893 小时前
Python----计算机视觉处理(Opencv:二值化,阈值法,反阈值法,截断阈值法,OTSU阈值法)
人工智能·python·opencv·计算机视觉
袁袁袁袁满5 小时前
Blackbox.Ai体验:AI编程插件如何提升开发效率
人工智能·ai编程·ai插件·chatgpt-4o·deepseek-r1满血版·免费大模型·gemini pro
摸鱼仙人~5 小时前
预训练微调类型分类
人工智能·自然语言处理·分类
申耀的科技观察5 小时前
【观察】拓展大模型应用交付领域“新赛道”,亚信科技为高质量发展“加速度”...
大数据·人工智能·科技
lboyj7 小时前
新能源汽车电控系统的大尺寸PCB需求:猎板PCB的技术突围
大数据·网络·人工智能
HABuo7 小时前
【YOLOv8】YOLOv8改进系列(5)----替换主干网络之EfficientFormerV2
人工智能·深度学习·yolo·目标检测·计算机视觉
訾博ZiBo7 小时前
AI日报 - 2025年3月16日
人工智能
(initial)7 小时前
大型语言模型与强化学习的融合:迈向通用人工智能的新范式——基于基础复现的实验平台构建
人工智能·强化学习