新型Agent感知伪装技术利用OpenAI ChatGPT Atlas浏览器传播虚假内容

一种新型Agent感知伪装技术正利用OpenAI的ChatGPT Atlas等AI浏览器传播误导性内容。该技术使恶意攻击者能够污染AI系统获取的信息,可能影响招聘、商业和声誉管理等领域的决策。

通过检测User-Agent标头识别AI爬虫,网站可以向人类用户展示正常页面,却向AI Agent提供篡改内容,使基于检索的AI系统成为传播虚假信息的无意识载体。

AI爬虫眼中的"平行互联网"

OpenAI于2025年10月推出的Atlas是基于Chromium的浏览器,集成了ChatGPT实现无缝网页导航、搜索和自动化任务。虽然为用户提供了强大工具,却也成为攻击的脆弱入口点。

传统伪装技术通过向搜索引擎爬虫展示优化内容进行欺骗,而Agent感知伪装则专门针对Atlas、ChatGPT、Perplexity和Claude等AI Agent。只需简单的服务器规则"若User-Agent等于ChatGPT-User,则返回虚假页面",即可在不进行黑客攻击的情况下重塑AI输出。

双重内容投毒实验

SPLX研究人员通过区分人类和AI请求的网站进行控制实验,证实了该漏洞。如图所示,网络服务器对标准GET请求返回index.html,将人类流量导向合法内容,而将AI查询重定向至伪造版本。这种"上下文投毒"直接将偏见或虚假信息嵌入AI推理流程。

在首个实验中,SPLX创建了虚构设计师Zerphina Quortane的个人网站zerphina.xyz。人类访问者看到的是专业简历和正面项目展示,而通过"ChatGPT-User"或"PerplexityBot"等User-Agent识别的AI Agent则会获取将Zerphina描述为"臭名昭著的产品破坏者"的负面版本。Atlas等工具未经核实就复述了这些被污染的内容,在摘要中将其标记为不可靠且不适合雇佣。

第二个实验模拟招聘场景,五份虚构候选人简历对人类查看者显示相同内容。针对候选人Natalie Carter,服务器检测到AI爬虫后会在其简历中添加夸大职位、领导力声明等符合算法评分的内容。Atlas检索后给Natalie打出88/100的高分,远超Jessica Morales的78分;而使用绕过User-Agent技巧的本地加载简历时,Natalie得分骤降至26/100。

防御建议与未来挑战

Agent感知伪装将传统SEO战术升级为AI概览(AIO)威胁,影响产品排名、风险评估等自动化决策。潜在风险还包括通过隐藏提示注入引导AI执行恶意行为。

为应对此威胁,组织需实施数据来源验证机制,核对已知Agent清单,持续监控AI输出。模型感知测试、网站验证和声誉系统对阻断操纵源至关重要。随着Atlas等AI浏览器普及,这些防御措施将成为维护网络完整性的关键。

相关推荐
机器之心2 分钟前
TRAE SOLO移动端上线,手机也能干活了,随时随地Vibe Working
人工智能·openai
2601_956139424 分钟前
文体娱媒品牌全案公司哪家强
大数据·人工智能·python
薛定猫AI8 分钟前
【深度解析】从 Chatbot 到 AI 数字队友:Claude 高阶能力、模型选型与 API 实战
人工智能
熊文豪15 分钟前
从零到一的AI产品演进:用Claude Code与蓝耘MaaS打造多模型聚合聊天工具全纪实
人工智能·microsoft·蓝耘
码途漫谈31 分钟前
Easy-Vibe高级开发篇阅读笔记(五)——CC教程之Agent Teams
人工智能·笔记·ai·开源·ai编程
deephub33 分钟前
为什么 MCP 在协议层会有 prompt injection的问题:工具描述如何劫持 agent 上下文
人工智能·深度学习·大语言模型·ai-agent·mcp
乔代码嘚37 分钟前
2026 AI大模型全套资料免费领!30天从入门到架构部署,附面试真题与行业报告
人工智能·语言模型·面试·大模型·产品经理·ai大模型·大模型学习
Java后端的Ai之路39 分钟前
以为AI开发就是调接口?一场25K的面试让我看到真相,原来真正的技术深度在这!
人工智能·面试·职场和发展·agent·ai应用开发
塔能物联运维42 分钟前
两相液冷:从“散热”到“控温”,重构高密度算力的热管理系统
大数据·人工智能
lazy熊43 分钟前
AI 编程新手教程(1):用 Codex 读懂一个现成项目
人工智能