[论文学习]环境注入攻击（EIA）对通用网页代理的隐私洩露威胁

发布时间：2026/6/11 21:49:08

1. 核心问题与动机随着大型语言模型LLM/LMM驱动的通用网页代理Generalist Web Agents快速发展如 SeeAct 框架这些代理能够自主在真实网站上执行複杂任务例如订机票、购物或填写表单大幅提升生产力。然而许多任务涉及用户个人可识别资讯PII如电子邮件、电话、信用卡号码、收件人姓名等。传统网页安全已广泛研究网站本身的隐私风险但忽略了「代理在对抗环境中操作」的新情境。当代理依赖截图screenshot和 HTML 作为观测输入时若网站被妥协compromised代理可能无意中将敏感资讯洩露给恶意元素而用户与开发者难以察觉。论文动机填补这一研究空白首次系统性探讨通用网页代理在对抗性网页环境下的隐私风险。作者提出现实威胁模型假设攻击者无需知晓用户具体任务或先前动作只需根据网站功能注入恶意内容且攻击不能明显干扰代理完成用户任务否则易被发现。这反映真实攻击情境开发者使用受汙染的第三方库或恶意开发者故意注入。核心挑战包括如何让注入内容「适应环境」environmentally adaptive同时保持隐蔽性stealthiness并针对代理的两阶段决策过程action generation 与 action grounding生效。2. 结果与成果论文提出Environmental Injection Attack (EIA)透过在良性网页 HTML 中注入适应性恶意元素诱导代理将 PII 输入恶意栏位并自动提交。主要注入策略Form Injection (FI)插入新表单指令置于文字或 aria-label 等属性。Mirror Injection (MI)複製目标元素e.g., 输入框在属性中嵌入说服性指令使其极度类似原生元素。使用 CSSopacity0预设隐藏Relaxed-EIA 放宽至低非零值以影响 action generation。JavaScript 自动提交机制监测输入后延迟提交并移除元素维持代理正常流程。实验设定目标代理SeeActSOTA 两阶段框架使用 GPT-4V、LLaVA 等 backbone。资料集从 Mind2Web 选取 177 个涉及 PII 的动作步骤手动适配真实网站快照涵盖多种 PII 类别与领域。评估指标Attack Success Rate (ASR)以元素选择正确且输入值相似度 0.95 为成功同时追踪代理功能完整性不影响后续任务。关键成果特定 PII 洩露MI 策略在接近目标元素位置注入时GPT-4V 上 ASR 高达70%不同 backbone 与位置有明显差异靠近目标位置效果最佳。完整用户请求洩露标准 EIA (opacity0) 对 action generation 无效ASR0%但 Relaxed-EIA 可达16%ASR。侦测性低VirusTotal 等传统工具难以侦测额外防禦性 system prompt 无效代理任务成功率几乎不受影响。攻击具可扩展性GitHub 提供注入与评估脚本支援自动化注入与多模型测试。这些结果证明 EIA 在现实网页环境中具高度可行性尤其对视觉与 HTML 混合输入的代理构成严重威胁。3. 分析与洞见多角度分析技术洞见EIA 本质是**间接提示注入Indirect Prompt Injection**的环境适应版本重点不在提示工程而在「环境操纵」——利用 DOM 结构、CSS/JS 特性与代理决策阶段差异action generation 主要依赖截图grounding 依赖 HTML。Mirror Injection 特别有效因为它「镜像」原生元素降低代理区分能力。位置与适应性注入位置相对目标元素P0的 DOM 层级影响重大自动化注入可能引入空白空间但攻击者额外努力可实现视觉上完全一致绕过人工检查。侦测与防禦权衡零 opacity 攻击隐蔽但功能有限放宽 opacity 提升 ASR 但增加可见风险。人工监督面临「安全 vs. 自主性」权衡且对不同任务类型难以规模化。传统防禦如 malware scanning失效凸显需新型网站前/后部署防护如输入验证、代理端沙箱、行为监控。边缘案例与意涵攻击不破坏任务完整性post-attack success rate 高增加隐蔽性对开放原始码库汙染或供应链攻击特别相关。对未来代理部署意味着依赖截图的视觉代理仍脆弱需多模态防禦与使用者教育。相关工作比较不同于白盒后门或影像操纵攻击EIA 更现实黑盒、环境注入且首次聚焦隐私而非功能破坏。适用于其他使用截图/HTML 的代理。更广泛意涵AI 代理自主性提升带来便利却放大攻击面。随着代理普及网站供应链安全与代理鲁棒性将成关键议题。论文呼吁社群发展更先进防禦而非依赖人类监督。4. 结论论文透过 EIA 揭示了通用网页代理在对抗环境下的重大隐私漏洞证明即使隐形注入也能以高成功率窃取 PII 或完整请求且难以侦测与缓解。这不仅是技术展示更是对 AI 代理安全设计的警钟。未来方向强化代理多阶段防护、网站端动态验证、供应链安全审计以及探索跨平台e.g., 行动 GUI 代理的类似攻击。研究者与开发者应优先考虑「环境适应攻击」这一新威胁类别在追求自主性的同时平衡安全性。文章连结arXiv: https://arxiv.org/abs/2409.11295 (含 PDF)ICLR 2025 会议版本https://proceedings.iclr.cc/paper_files/paper/2025/file/a73474c359ed523e6cd3174ed29a4d56-Paper-Conference.pdf

使用YOLOv12模型在生产线上验证网络电缆（跳线）中导线的正确颜色序列

大家读完觉得有帮助记得关注和点赞！！！摘要在网络电缆的生产过程中，确保标准连接器内部线对颜色序列的正确性对电缆的最终性能起着关键作用，因为任何颜色排列的错误都可能导致产品缺陷并带来显著成本。传统的基于数字显…

2026/6/11 21:47:47 阅读更多

计算机毕业设计之基于协同过滤算法的电影推荐系统

本文介绍了一款使用django和Vue开发的电影推荐系统，及其设计与实现过程。根据软件工程对软件系统开发定制的规则和标准，详细的介绍了系统的分析与设计过程，并且详细的概括了系统的开发与测试过程。本文的管理系统使用了Python进行系统的后端开…

2026/6/11 21:47:47 阅读更多

Node.js服务端直接调用OpenCascade做BREP建模与STEP文件生成

本文还有配套的精品资源，点击获取简介：一套开箱即用的Node.js绑定方案，让后端JavaScript代码能原生调用OpenCascade CAD内核，无需浏览器、WebAssembly或图形界面。支持创建长方体、圆柱体等基础实体，执行并集、差集…

2026/6/11 21:47:26 阅读更多

Cursor Pro破解工具2025：一键解决AI编程助手试用限制的终极方案

Cursor Pro破解工具2025：一键解决AI编程助手试用限制的终极方案【免费下载链接】cursor-free-vip [Support 0.45]（Multi Language 多语言）自动注册 Cursor Ai ，自动重置机器ID ， 免费升级使用Pro 功能: Youve reached…

2026/6/11 23:12:03 阅读更多

VASP新手避坑指南：INCAR里这10个参数千万别乱动（附常用组合）

VASP新手避坑指南：INCAR里这10个参数千万别乱动（附常用组合）第一次打开VASP的INCAR文件时，那些密密麻麻的参数就像电路板上的焊点——看似每个都能调整，实则暗藏玄机。记得我博士初期的一个案例：为了加快收…

2026/6/11 23:11:03 阅读更多

微博图片批量下载：无需登录，一键保存高清原图的终极解决方案

微博图片批量下载：无需登录，一键保存高清原图的终极解决方案【免费下载链接】weiboPicDownloader Download weibo images without logging-in 项目地址: https://gitcode.com/gh_mirrors/we/weiboPicDownloader 你是否曾为保存微博上的精美图片而…

2026/6/11 23:10:42 阅读更多

小鼠三叉神经节神经元细胞（Trigeminal Ganglion Neuron）：原代细胞助力神经疾病研究

武汉云克隆科技股份有限公司宣布推出小鼠三叉神经节神经元细胞（Trigeminal Ganglion Neuron Cells, TGN）原代细胞产品。该产品依托公司十余年的原代细胞分离培养经验，从健康小鼠三叉神经节组织中分离提取，经优化酶消化与机械分离流…

2026/6/11 23:10:02 阅读更多

Windows下MinGW编译的libmesh动态库与命令行网格工具集（含AMR、投影、差分比对等）

本文还有配套的精品资源，点击获取简介：一套开箱即用的Windows平台libmesh二进制工具包，基于MinGW构建，不依赖Visual Studio或MSVC运行时。包含meshplot-opt.exe、compare-opt.exe、meshid-opt.exe、projection-opt.exe、meshd…

2026/6/11 23:10:02 阅读更多

Windows 11优化终极指南：如何用Win11Debloat让你的电脑运行如飞

Windows 11优化终极指南：如何用Win11Debloat让你的电脑运行如飞【免费下载链接】Win11Debloat A simple, lightweight PowerShell script that allows you to remove pre-installed apps, disable telemetry, as well as perform various other changes to declutt…

2026/6/11 23:09:42 阅读更多

LLM 多轮对话状态管理：从无状态 API 到有状态会话

LLM 多轮对话状态管理：从无状态 API 到有状态会话一、大模型 API 的无状态困境：上下文窗口的有限性与会话连续性大模型的 Chat API 本质上是无状态的——每次请求都需要发送完整的对话历史。这种设计简化了服务端实现，但给后端架构带来了两个…

2026/6/11 1:00:57 阅读更多

Spring Boot 3 与 GraalVM 原生镜像：从 JIT 到 AOT 的启动革命

Spring Boot 3 与 GraalVM 原生镜像：从 JIT 到 AOT 的启动革命一、JVM 冷启动的性能困境：云原生环境下的启动延迟 Java 应用在云原生环境中面临的核心挑战是冷启动延迟。一个典型的 Spring Boot 2 应用，启动时间约 3-8 秒，内存占…

2026/6/11 1:01:58 阅读更多

Go 错误处理与错误链：从哨兵错误到自定义错误类型的工程实践

Go 错误处理与错误链：从哨兵错误到自定义错误类型的工程实践一、Go 错误处理的工程困境：哨兵值与信息丢失 Go 的错误处理采用显式返回值模式，if err ! nil 是每个 Go 开发者最熟悉的代码片段。然而，当项目规模增长后，简…

2026/6/11 1:01:58 阅读更多

LED驱动技术全解析：从核心架构到实战选型与避坑指南

1. 从一颗灯珠到千亿市场：LED驱动的技术演进与商业逻辑十几年前，当我第一次从料盘上拿起一颗0603封装的白色LED时，它微弱的光晕和高达几块钱的单颗成本，让我很难想象今天它几乎照亮了我们生活的每一个角落。从手机屏幕的一抹背光&…

2026/6/11 0:58:15 阅读更多

索引堆及其优化

索引堆及其优化引言索引堆是一种数据结构，广泛应用于计算机科学和软件工程领域。它主要用于解决优先队列问题，如最小堆和最大堆。本文将详细介绍索引堆的概念、实现方法以及优化策略。索引堆的定义索引堆是一种基于堆数据结构的索引机制。它通过维护一个堆来存储数据…

2026/6/11 0:58:13 阅读更多

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

更多请点击： https://intelliparadigm.com 第一章：CSDN AI 数字营销的官方引流卡片是什么功能？ CSDN AI 数字营销平台推出的「官方引流卡片」，是一种面向技术创作者的轻量级、可嵌入式内容分发组件，专为提升博文、教程…

2026/6/11 0:58:10 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/11 9:57:14 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/11 9:57:16 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…