ai安全

带娃的IT创业者14 天前
安全·llm·大语言模型·开源项目·提示词工程·ai安全·系统提示词
解构黑盒:从开源项目看顶级大模型系统提示词的演进与安全边界在当今的人工智能开发领域,大语言模型(LLM)早已不再是简单的“对话机器”,而是演变成了具备复杂逻辑、工具调用能力和多模态处理能力的智能体。对于中级开发者而言,理解这些模型如何“思考”并不仅是为了满足好奇心,更是为了在实际工程中更精准地控制模型行为,减少幻觉,提升系统的鲁棒性。
行者-全栈开发16 天前
人工智能·rce·漏洞修复·ai安全·langflow·cvss 10.0·cve-2026-33017
CVE-2026-33017:Langflow AI工作流平台未授权RCE漏洞深度剖析与紧急修复指南摘要: 2026年5月,开源AI工作流平台Langflow被曝出CVSS 10.0满分的未认证远程代码执行漏洞(CVE-2026-33017)。该漏洞武器化速度创纪录——从披露到公开EXP仅用20小时,攻击者无需任何认证即可执行任意Python代码,完全控制服务器。某AI初创公司因未及时修复,导致核心模型参数和训练数据泄露,直接损失超¥600万元。我在本文中将从漏洞原理、快速武器化分析、修复方案、AI平台安全加固四个维度进行深度剖析,为AI工程师和安全从业者提供完整防护指南。
键盘侠伍十七20 天前
人工智能·prompt·ai安全
Gandalf Lakera AI Prompt Injection 靶场深度教程:从 Level 1 到 Level 8 全面攻防解析在大模型安全的众多研究方向中,Prompt Injection(提示词注入)是最具实战意义、也最难彻底解决的安全威胁之一。Lakera 公司推出的 Gandalf AI 靶场(gandalf.lakera.ai)是目前最经典的 LLM 注入攻防练习平台——它把抽象的安全理论变成了一个可以亲手"攻破"的闯关游戏。
Resistance丶未来21 天前
人工智能·大模型·api·claude·ai安全·魔芋ai·maigateway
管控用量,降本增效,MAI Gateway:助力企业搭建 Tokens 统一管理体系作为技术负责人,你一定有过这样的经历:2026 年,当 AI 从 "尝鲜" 变成 "刚需",算力成本失控已经成为所有企业的头号难题。Gartner 最新数据显示:62% 的企业 AI 成本超支 175% 以上,头部企业单月账单突破 1.2 亿美元,甚至有 3 人小团队因为密钥泄露直接破产。
xian_wwq22 天前
笔记·学习·ai安全
【学习笔记】「大模型安全:攻击面演化史」第 03 篇-数据投毒大模型的安全问题不是某一个漏洞,而是一条攻击面持续扩大的演化线——从输入层(Prompt Injection / Jailbreak)→ 训练层(数据投毒 / 模型窃取)→ 执行层(Agent安全)→ 评估与治理层(红队方法论 / 安全左移)。每一层的攻击都让上一层的防御变得不够用。
xian_wwq22 天前
笔记·学习·ai安全
【学习笔记】「大模型安全:攻击面演化史」第 05 篇-Agent安全大模型的安全问题不是某一个漏洞,而是一条攻击面持续扩大的演化线——从输入层(Prompt Injection / Jailbreak)→ 训练层(数据投毒 / 模型窃取)→ 执行层(Agent安全)→ 评估与治理层(红队方法论 / 安全左移)。每一层的攻击都让上一层的防御变得不够用。
xian_wwq22 天前
笔记·学习·ai安全
【学习笔记】「大模型安全:攻击面演化史」第 04 篇-模型窃取与供应链安全大模型的安全问题不是某一个漏洞,而是一条攻击面持续扩大的演化线——从输入层(Prompt Injection / Jailbreak)→ 训练层(数据投毒 / 模型窃取)→ 执行层(Agent安全)→ 评估与治理层(红队方法论 / 安全左移)。每一层的攻击都让上一层的防御变得不够用。
xian_wwq22 天前
笔记·学习·ai安全
【学习笔记】「大模型安全:攻击面演化史」第 06 篇-红队方法论大模型的安全问题不是某一个漏洞,而是一条攻击面持续扩大的演化线——从输入层(Prompt Injection / Jailbreak)→ 训练层(数据投毒 / 模型窃取)→ 执行层(Agent安全)→ 评估与治理层(红队方法论 / 安全左移)。每一层的攻击都让上一层的防御变得不够用。
xian_wwq1 个月前
笔记·学习·ai安全
【学习笔记】提示词注入完全指南:五种变体,一套防御体系图1:提示词注入完全指南:五种变体,一套防御体系「Prompt Injection」这个词大家都听过,但大多数团队对它的理解停在第一层——「用户输入里加了『忽略上面的指令』」。
安当加密1 个月前
rce·数据库安全·ai安全·web应用安全·llm漏洞
Langroid LLM 框架 CVSS 9.8 RCE + WP Maps Pro 在野利用:当 AI 代理成为攻击入口2026年6月1日,两个 CVSS 9.8 级别的严重漏洞同时登上安全头条,而且它们指向了同一个趋势:攻击入口正在从传统 Web 应用向 AI 代理层和低门槛运营工具迁移。
xian_wwq1 个月前
笔记·学习·ai安全
【学习笔记】大模型应用安全落地实践参考文献:1、大模型应用安全落地实践-完整PPT分享
Rubin智造社1 个月前
纵深防御·ai安全·提示词注入·agent安全·openclaw·安全边界·沙箱防护
OpenClaw实操指南42|安全边界2:提示词注入与沙箱防护边界不是用来堵住所有坏东西的墙,而是用来划定“炸了也没事”的范围上一篇文章我们讨论了OpenClaw部署中“被忽略的安全基线”,从公开暴露检测、敏感文件审计到恶意插件扫描,搭建了一个基础的安全扫描框架。但安全基线只能帮你发现“哪里出问题了”,真正的防御,需要回答一个更本质的问题:当AI Agent被恶意指令劫持时,你的系统能扛住吗?
Rubin智造社1 个月前
权限管理·ai安全·openclaw·docker沙箱·凭据分离·白名单机制·初创企业合规
OpenClaw 实操指南 41|安全边界 1:白名单、权限、凭据分离对于很多刚起步的初创团队来说,引入 OpenClaw 这样的 AI Agent 往往是为了提效:让机器人自动查文档、跑脚本、甚至直接操作数据库。但在兴奋于“自动化”带来的便利时,我们很容易忽略一个致命问题:如果这个 Agent 被恶意诱导,或者因为配置失误执行了危险指令,后果谁来承担?
这是谁的博客?1 个月前
人工智能·ai·大模型·agent·ai安全
AI 领域精选新闻(2026-05-24)本周 AI 领域重点关注:Anthropic 收购 Stainless 开发工具公司引发行业震动、欧盟 AI 法规简化协议达成、AI Agent 安全漏洞问题凸显。共精选 8 条技术新闻,涵盖大模型、安全、监管、芯片等方向。
admin and root1 个月前
微信小程序·渗透测试·自动化·攻防演练·ai安全·claude code·ai自动化渗透测试
Claude+Trae大模型 配置Chrome MCP联动Yakit自动化渗透测试Chrome MCP Server 是一个基于chrome插件的 模型上下文协议 (MCP) 服务器,它将您的 Chrome 浏览器功能暴露给 Claude 等 AI 助手,实现复杂的浏览器自动化、内容分析和语义搜索等。与传统的浏览器自动化工具(如playwright)不同,Chrome MCP server直接使用您日常使用的chrome浏览器,基于现有的用户习惯和配置、登录态,让各种大模型或者各种chatbot都可以接管你的浏览器,真正成为你的日常助手
诺未科技_NovaTech1 个月前
ai安全·agent 365
微软AI时代的再一次革新:AI Agent 安全治理与实践指南随着AI代理在企业中的大规模部署,传统安全治理模式面临根本性挑战。微软于2026年5月1日正式发布的Agent 365,被定义为“AI代理的统一控制平面”,通过整合Microsoft Entra、Purview和Defender三大安全套件,将成熟的“零信任”安全模型系统性扩展至AI代理领域。本文从身份与访问控制、数据安全保护和威胁防护三个维度深度解析Agent 365的安全架构,分析其核心安全机制与设计理念,为CIO、CISO及安全架构师提供系统性的治理参考。
带娃的IT创业者1 个月前
人工智能·ai编程·ai安全·源码泄露·claude code·工程伦理
Claude Code 源码泄露事件深度剖析:当 AI 编程工具不再“透明”2026年3月31日,一篇关于 Claude Code 源码泄露的分析文章在 Hacker News 上引发了超过1200票的热议。这不仅仅是一次简单的代码泄露事件——它揭示了当前 AI 编程助手在工程实践中的深层矛盾:我们以为自己在使用智能工具,实际上却在与一堆“假工具”、“挫败感正则表达式”和“隐身模式”斗智斗勇。
XD7429716361 个月前
人工智能·科技·安全·ai安全·科技早报
科技早报|2026年5月15日:AI 安全开始补信任层一句话导读:今天最值得看的不是模型能力又涨了多少,而是 AI 产品和开发平台开始把账号安全、敏感对话、供应链防护和运行时权限当成默认能力来补。OpenAI、GitHub 和 Microsoft 都在同一方向上发力:AI 进入生产后,真正决定能不能放心用的,已经是信任层而不是演示效果。
玖日大大2 个月前
人工智能·语言模型·回归·llm·论文解读·ai agent·ai安全
2026十大LLM研究突破:扩散语言模型挑战自回归、Unicode隐形注入、AI操纵性评估 — 大模型从狂飙走向可控2026年5月,Hugging Face 论文热度榜上十篇高票 LLM 论文指向同一个方向:大模型的核心命题变了。