技术栈
人工智能安全
镰刀韭菜
9 天前
人工智能安全
·
llama guard
·
qwen3guard
·
实时流式检测
·
controversial
·
分类器路线
·
编排路线
【AI安全】Qwen3Guard: 实时流式检测实现AI模型安全防护新标杆
在多项主流安全评测基准上,Qwen3Guard 表现卓越,稳居行业领先水平,全面覆盖英语、中文及多语言场景下的提示与回复安全检测任务。 测试显示,Qwen3Guard的能力范围覆盖: ✅ 越狱攻击 ✅ 涉黄内容 ✅ 政治敏感 ✅ 个人信息泄露(PII) ✅ 违法内容 ✅ 涉恐信息 ✅ 侵权行为 ✅ 不道德内容
jazz_bin
9 个月前
人工智能
·
算法
·
语言模型
·
unlearning
·
多目标优化
·
人工智能安全
人工智能安全——大语言模型遗忘学习(LLM unlearning)与多目标优化算法
Multi-Objective Large Language Model Unlearning(ICASSP-2025)
合天网安实验室
1 年前
深度学习
·
后门攻击
·
人工智能安全
·
ai安全
深度学习后门攻击分析与实现(二)
在本系列的第一部分中,我们已经掌握了深度学习中的后门攻击的特点以及基础的攻击方式,现在我们在第二部分中首先来学习深度学习后门攻击在传统网络空间安全中的应用。然后再来分析与实现一些颇具特点的深度学习后门攻击方式。
数字化营销工兵
1 年前
microsoft
·
chatgpt
·
copilot
·
人工智能安全
·
人工智能隐私
·
dr did not read
·
tl too long
微软如何打造数字零售力航母系列科普06 - 如何使用微软的Copilot人工智能
Copilot和ChatGPT有很多相似之处,但微软的聊天机器人本身就有一定的优势。以下是如何对其进行旋转,并查看其最引人注目的功能。
Che_Che_
2 年前
论文阅读
·
人工智能
·
语言模型
·
transformer
·
漏洞检测
·
人工智能安全
论文阅读-Transformer-based language models for software vulnerability detection
「分享了一批文献给你,请您通过浏览器打开 https://www.ivysci.com/web/share/biblios/D2xqz52xQJ4RKceFXAFaDU/ 您还可以一键导入到 ivySCI 文献管理软件阅读,并在论文中引用 」
我是有底线的