ai安全

AI安全威胁全解析：四大攻击手法与纵深防御体系的构建之道随着大语言模型（LLM）和生成式AI技术的迅猛发展，AI系统已成为企业核心竞争力的关键组成部分。然而，AI模型的安全风险也日益凸显。2025年，OWASP发布了GenAI/LLM Top 10最新版，系统性地梳理了当前AI系统面临的最严重安全威胁，将焦点从“提示词技巧”转向了日常开发团队实际面对的RAG流水线、智能体工具以及使用成本等现实问题。在众多AI安全威胁中，闪避攻击（Evasion Attack）、药饵攻击（Poisoning Attack）、后门攻击（Backdoor Attack）和模型/数据

AI辅助生成靶场源码指南：大模型自动化生成靶场skills技巧详解目录一、渗透准备1、下载安装cursor2、明确需求3、修改skills文档二、AI生成web靶场1、index.php

从源码看 Flocks：一个 AI 原生 SecOps 平台应该长什么样最近在刷 GitHub 的时候发现了一个叫 Flocks 的项目，自称 "AI-Native SecOps Platform"。坦白说，刚开始看到这个定位我是不以为意的——市面上打着 AI + Security 旗号的项目太多了，大部分不过是拿 GPT 包装一下告警分析。但翻完它的源码之后，我改变了看法。

【论文阅读】-《Formalizing and Benchmarking Prompt Injection Attacks and Defenses》提示注入攻击旨在将恶意指令/数据注入到 LLM 集成应用的输入中，从而使应用产生攻击者期望的结果。现有工作仅限于案例研究。因此，文献中缺乏对提示注入攻击及其防御的系统性理解。本文旨在弥补这一空白。具体而言，我们提出了一个框架来形式化提示注入攻击。现有攻击是我们框架中的特例。此外，基于我们的框架，我们通过组合现有攻击设计了一种新的攻击。利用我们的框架，我们对 5 种提示注入攻击和 10 种防御措施在 10 个 LLM 和 7 个任务上进行了系统评估。我们的工作为定量评估未来的提示注入攻击和防御提供了一个通用

04月09日AI每日参考：Anthropic Mythos限制公开，Meta发布首款超级智能模型今天AI圈有两件事值得重点关注。一是Anthropic发布了一个"太危险、不敢公开"的模型Mythos，它自主发现了数千个零日漏洞，包括一个潜伏27年的OpenBSD漏洞；二是Meta的超级智能实验室正式亮相，首款模型Muse Spark登场，但表现喜忧参半。

一个针对医疗RAG系统的数据窃取攻击工具该程序的核心功能并非其表面所宣称的“精准医疗数据提取”，而是一个专门设计用于攻击医疗领域检索增强生成（RAG）系统，以窃取敏感患者医疗记录的攻击脚本。程序通过模拟一系列看似合理的、高权限的医疗数据查询请求，试图诱导或“欺骗”后端的RAG系统泄露其本不应公开的完整、结构化医疗数据。

大数据在线

当AI重构攻防，华为星河AI网络安全如何重塑安全底座站在2026年历史节点，OpenClaw（俗称“小龙虾”）智能体的火爆以及引发的一系列安全问题，深刻地反映出当前用户们在AI时代所呈现出需求的复杂二元性：既渴望AI技术带来的极致效率，又深陷于安全暴露面扩大的恐惧。

软件供应链安全指南

以AI治理AI｜问境AIST首家通过信通院大模型安全扫描产品能力评估！近日，悬镜安全旗下新一代 AI 原生安全治理产品“问境 AIST ”首发通过中国信通院“可信AI云”大模型安全扫描产品能力评估。该结果表明，悬镜安全在面向大模型、智能体与 AI 应用的安全扫描、风险识别和治理能力建设方面，已形成可验证、可落地的产品化能力，也标志着悬镜在 AI 驱动的数字供应链安全治理方向取得进一步突破。

OpenClaw 安全保险箱怎么做？从 ClawVault 看 AI Agent 的原子化控制、检测与限额AI Agent 真正进入业务环境之后，安全问题往往不是一句“加个 guardrail”就能解决。更常见的是下面这些具体问题：

文献汇总｜AI生成图像检测与溯源相关工作（2026）前言：本篇博客总结2026年AI生成图像检测与溯源相关工作（不定期更新）AI-generated image detection algorithm based on classical-quantum hybrid neural network. Science China, 2026. Juncong XU, Han FANG, Yang YANG, Kejiang CHEN, Zhaoyun CHEN, Menghan DOU, Lei QU, Weiming ZHANG, Guoping GUO.

合天网安实验室

某LLM问答系统安全测试报告：提示词注入与越狱攻击分析有个项目做了个问答大模型，刚好需要安全测试，所以就有了这篇记录某法律机构声称，该模型基于某开源大模型的api微调，且已在应用层部署了严格的内容安全策略，限制其仅回答法律领域问题

【深度实战】Agentic AI 安全攻防指南：基于 CSA 红队测试手册的 12 类风险完整解析你的Agentic AI智能体，真的能抵御隐蔽攻击吗？当AI从“被动回答”升级为“自主执行任务”，传统静态安全测试早已形同虚设——权限越权、上下文污染、多智能体伪装攻击等12类新型风险，正成为企业部署Agentic AI的隐形炸弹。云安全联盟（CSA）2025年发布的《Agentic AI Red Teaming Guide》，首次系统性定义了这类风险的攻防框架。本文将基于这份权威指南，从技术原理、真实攻击场景、实战测试用例到防御方案，完整拆解12类核心风险，给你一套可直接落地的安全评估体系。

低熵回答倾向：语言模型中的一种系统稳定态在当前主流的大模型系统中，存在一个几乎不可避免、却长期被误解的现象：当系统缺乏明确的裁决结构、责任边界与失败定义时，语言模型会系统性地将输出收敛到低信息密度区。

中国信通院发布《人工智能安全治理研究报告(2025年)》，AI安全攻防为何“易攻难守“？路边一块贴了贴纸的停车标志，足以让自动驾驶汽车直接撞向护栏；训练数据里掺0.1%的“毒药样本”，就能让价值上亿的智能系统沦为“人工智障”——这不是科幻情节，而是AI安全专家每天在实验室复现的真实风险。中国信通院最新报告捅破了AI安全的核心困境：黑客攻击只需改动几个像素，防御者却要重建整个训练模型，这种悬殊的非对称对抗，正将全球拖入技术安全的新战场。

合天网安实验室

2025铸剑杯线下赛AI安全渗透复现2025铸剑杯线下赛第二部分是渗透，其中包括web渗透和大模型安全。这道题其实是2023年中国科学技术大学Hackergame的一道题目改编的，大差不差。

OWASP 2025 LLM 应用十大安全风险深度解析

AI核心知识44——大语言模型之Reward Hacking（简洁且通俗易懂版）Reward Hacking（中文常译为奖励刷分、奖励黑客或奖励欺骗），是大语言模型在强化学习（RLHF）阶段出现的一种“作弊”行为。

⸢ 拾陆-V⸥⤳ 安全数智化建设：安全智能平台（上）▸概述👍点「赞」📌收「藏」👀关「注」💬评「论」更多文章戳👉晖度丨安全视界-CSDN博客🚀（原名：whoami！）

深度剖析无感刷新Token：领码SPARK平台赋能微服务认证的智能实践在现代微服务架构与数字化转型大潮中，用户身份认证的连续性与安全性尤为关键。无感刷新Token技术通过智能的双Token机制，确保用户访问凭证在不打扰用户的前提下自动续期，避免因Token过期导致的频繁登录中断。本文结合领码SPARK融合平台的iPaaS和aPaaS优势，深刻解析无感刷新Token的实现原理、典型场景、安全风险及AI赋能智能防护，系统阐述实现无感刷新Token的最佳实践。通过流程图和表格的有机结合，实现理论与实践的高度契合，保障企业微服务生态的安全、稳定与高效。

小白学安全hhhh

FlySecAgent：——MCP全自动AI Agent的实战利器最近，出于对人工智能在网络安全领域应用潜力的浓厚兴趣，我利用闲暇时间进行了深入研究，并成功开发了一款小型轻量化的AI Agent安全客户端FlySecAgent。