agent安全

Rubin智造社19 天前
纵深防御·ai安全·提示词注入·agent安全·openclaw·安全边界·沙箱防护
OpenClaw实操指南42|安全边界2:提示词注入与沙箱防护边界不是用来堵住所有坏东西的墙,而是用来划定“炸了也没事”的范围上一篇文章我们讨论了OpenClaw部署中“被忽略的安全基线”,从公开暴露检测、敏感文件审计到恶意插件扫描,搭建了一个基础的安全扫描框架。但安全基线只能帮你发现“哪里出问题了”,真正的防御,需要回答一个更本质的问题:当AI Agent被恶意指令劫持时,你的系统能扛住吗?
冲上云霄的Jayden2 个月前
prompt·agent·智能客服·langchain4j·agent安全·langgraph4j·prompt注入
LangGraph4j+LangChain4J 实验智能客服系统增加基于LLM 解决Prompt注入问题考量了Prompt注入对安全的问题后,基于LangGraph4j+LangChain4J 实验智能客服系统、恶意用户Prompt注入和处理的思考 贴上实验的实现代码。
?Anita Zhang2 个月前
隐私计算·大模型安全·agent安全·llm数据安全·rag安全
企业AI用数安全架构设计:从数据脱敏到智能体隐私沙箱话题标签:大模型安全 LLM数据安全 RAG安全 Agent安全 隐私计算企业AI落地面临的核心矛盾:高敏数据不能出域,但AI需要数据才能产生价值。传统数据安全方案为"人操作数据"设计,无法应对AI高频、模糊边界、自主执行的用数特征。
Ho1aAs3 个月前
安全·web安全·网络安全·ai·智能体·agent安全·openclaw
『OpenClaw安全』CVE-2026-25253:ClawJacked One-Click RCE使用漏洞修复前一个版本 https://github.com/openclaw/openclaw/tree/v2026.1.24 按照官方教程安装,此时老版本还是叫clawdbot
有点不太正常7 个月前
论文阅读·大模型·agent安全
《ShadowCoT: Cognitive Hijacking for Stealthy Reasoning Backdoors in LLMs》——论文阅读CoT通过生成逐步推理过程,大幅提升了 LLMs的准确性和可解释性,但推理链的拉长也暴露了新的攻击面 —— 中间推理步骤本身可能成为恶意操纵的载体。传统后门攻击多针对输入输出的 “表面层”(如注入触发词、篡改输出 tokens),而基于CoT的攻击需深入模型内部推理轨迹,现有方法缺乏对推理动态过程的直接干预,且易被检测。
我是有底线的