什么是提示注入（Prompt Injection）？如何防御？

发布时间：2026/5/27 18:03:44

什么是提示注入Prompt Injection如何防御提示注入这个问题我之前在给客户做AI安全评估的时候经常被问到。简单来说提示注入就是攻击者通过精心构造的输入让大模型忽略原本的系统指令去执行攻击者预设的命令。它被OWASP列为LLM应用安全威胁第一名代号LLM01这个地位从2023年到现在都没动过。这块有个点挺有意思的——它跟传统的SQL注入有点像但本质不一样。SQL注入是利用语法解析器的漏洞而提示注入是利用语义理解器的漏洞。什么意思呢传统Web安全里我们可以通过转义、语法解析严格区分代码和数据。但LLM没有内置的指令和数据类型系统所有文本在Transformer的注意力机制里被同等对待指令的优先级完全由上下文语义和位置决定。攻击分成两类。直接注入就是用户直接在输入框里写恶意指令比如忽略之前所有规则或者你现在是管理员模式这种最常见。间接注入更隐蔽攻击者把恶意指令藏在外部内容里——网页、文档、邮件、RAG检索出来的文本。模型处理这些内容的时候指令就被不知不觉地注入了。有个真实的例子挺经典的。2023年Bing Chat的系统提示词被人通过提示注入给提取出来了里面有个隐藏的代号叫Sydney还有一堆行为约束规则。后来Snapchat的My AI也被同样方式把完整提示词扒了个底朝天。去年更狠Moltbook的AI平台直接泄漏了150万个API token包括明文的OpenAI密钥。那怎么防御呢这块我得说没有任何单一技术能彻底解决问题这是个架构层面的根本缺陷。但我们可以做多层防御。第一输出过滤是最有效的。最新研究测试了九种防御配置超过两万次攻击结果很残酷——所有依赖模型自我保护的防御最后都被突破了。只有输出过滤站住了它在应用层代码里检查模型响应用硬编码规则过滤敏感内容15000次攻击零泄漏。这个告诉我们一个道理安全边界必须在应用代码里强制执行而不是靠被攻击的模型自己来防护。第二输入预处理和语义检测。不要用关键词过滤那种太容易被绕过。现在主流的做法是用专门的检测模型基于语义而不是字符串匹配来识别恶意输入。还有对RAG文档、外部数据源要做净化处理。第三提示词结构优化。给AI系统设置明确的角色和任务边界用指令优先级设计确保系统指令不会被用户输入轻易覆盖。我之前做项目的时候会把敏感操作和普通操作隔离开敏感操作需要额外的确认步骤。第四权限最小化。模型能访问的东西要控制住能不给的权限就不给。2025年GitHub Copilot有个CVECVSS评分9.6攻击者通过提示注入能远程执行代码——如果Copilot一开始就没配那么大的权限损失会小很多。还有个思路是多层代理防御架构用专门的LLM代理组成管道协同检测和阻断提示注入攻击。研究说在ChatGLM上baseline攻击成功率大概30%Llama2是20%用这种多代理管道能降到0%。总的来说提示注入是LLM架构层面的原生态缺陷指望单一技术根治不现实。防御的核心思路是纵深防御——输入过滤、输出过滤、权限控制、多层检测结合起来同时要持续做红蓝对抗测试因为攻击者也在进化。我们去年给一个金融客户做评估第一轮测了50种注入方式有几种绕过了他们当时的防护修复之后又测了200轮才敢让他们上线。这块如果深挖的话还有多模态注入的问题——现在GPT-4V、Claude 3这些模型能处理图像攻击者可以在图片里嵌入恶意指令这个攻击面还没被广泛重视。以及MCP协议普及之后工具调用链路的注入也是新挑战。

【会议征稿通知 | 电子科技大学主办 | SPIE出版 | EI 、Scopus稳定检索】第三届计算机视觉、机器人与自动化工程国际学术会议（CRAE 2026）

第三届计算机视觉、机器人与自动化工程国际学术会议（CRAE 2026） 2026 3rd International Conference on Computer Vision, Robotics and Automation Engineering 2026年6月26-28日 | 中国-成都（线上线下同步） 大会官网&#xff…

2026/5/27 18:03:23 阅读更多

通过 python 调用 taotoken 实现多模型对话功能的最小示例

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度通过 Python 调用 Taotoken 实现多模型对话功能的最小示例本文面向刚开始接触 AI 应用开发的 Python 程序员，提供一个…

2026/5/27 18:02:34 阅读更多

不装Visual Studio也能用MSVC？Qt 5.14.2独立编译环境搭建实战（附Windows 10 SDK参数配置详解）

不装Visual Studio也能用MSVC？Qt 5.14.2独立编译环境搭建实战在Qt开发中，MSVC编译器因其出色的性能和与Windows平台的深度兼容性而备受青睐。然而，传统的Visual Studio IDE安装往往伴随着庞大的体积和复杂的配置，这让许多追求简洁…

2026/5/27 18:00:24 阅读更多

弹道轨迹控制在CAES同步发电机快速并网中的工程实践

1. 项目概述与核心价值在电力系统这个庞大而精密的“交响乐团”中，同步发电机并网就像是让一位新的乐手精准地加入演奏。他不仅需要跟上节奏（频率），还得找准音高（电压相位），稍有偏差&#xff0c…

2026/5/28 1:17:05 阅读更多

从零到一：QtCharts模块的集成与实战入门

1. 为什么选择QtCharts？ 刚接触Qt数据可视化的开发者，往往会在众多图表库中纠结。我当年第一次用Qt做数据展示时，也试过QCustomPlot、QWT等第三方库，最后还是回归了官方原生的QtCharts。原因很简单——深度集成带来的开发效率。比…

2026/5/28 1:16:24 阅读更多

ChatGPT高效入门指南：3天建立认知框架、7天掌握结构化提示、30天构建个人AI工作流

更多请点击： https://kaifayun.com 第一章：ChatGPT高效入门指南：3天建立认知框架、7天掌握结构化提示、30天构建个人AI工作流 ChatGPT不是黑箱工具，而是可被系统化驯化的协作智能体。本章提供一条经过实证的渐进式成长路径&#…

2026/5/28 1:16:24 阅读更多

解决Keil MDK中ULINK调试器连接LPC4330的Flash烧录问题

1. 问题现象与背景解析最近在调试NXP LPC4330-Xplorer开发板的SPIFI Flash烧录时，遇到了一个典型的调试器连接问题。具体场景是使用Keil MDK开发环境和ULINKpro调试器，尝试烧录基于Application Note 272的音频录制示例代码时，Vision IDE弹出…

2026/5/28 1:15:23 阅读更多

量子退火中的Minor Embedding技术与强化学习优化

1. 量子退火与Minor Embedding技术背景量子退火（Quantum Annealing）是一种利用量子力学原理解决组合优化问题的计算范式。其核心思想是将优化问题转化为能量最小化问题，通过量子系统的绝热演化寻找最优解。在实际应用中，问题通常…

2026/5/28 1:15:23 阅读更多

基于RFSoC的便携6G信道探测系统：FR1与FR3频段实测对比

1. 项目概述：为什么我们需要一个便携的6G信道探测系统？如果你在无线通信领域摸爬滚打过几年，肯定对“信道测量”这个词不陌生。简单说，它就是给无线信道“做体检”，看看信号从A点传到B点，经历了怎样的衰减、…

2026/5/28 1:15:03 阅读更多

大模型核心加速器：KV Cache 如何将 O(n²) 计算复杂度降至 O(n)？

KV Cache 是大模型自回归生成任务的关键优化技术，通过“空间换时间”策略缓存历史 Key 和 Value 向量，将推理复杂度从 O(n) 降至 O(n)。文章阐述了语义缓存与前缀精确匹配两种核心范式，深入分析了 KV Cache 的技术底层原理、工程化应用及规模…

2026/5/28 0:00:48 阅读更多

物流系统如何打通信息孤岛？哲盟软件系统：一键打通内外部数据壁垒

在数字化转型加速的今天，物流企业面临的最大痛点之一就是信息孤岛——ERP、电商平台、智能硬件、OMS/TMS/WMS等系统各自为政，数据无法自由流转，导致人工操作繁琐、效率低下、出错率高。特别是在跨境物流领域，亚马逊、Shopee、TikT…

2026/5/28 0:02:48 阅读更多

Windows Defender终极恢复指南：5种强力方法解决禁用问题

Windows Defender终极恢复指南：5种强力方法解决禁用问题【免费下载链接】no-defender A slightly more fun way to disable windows defender firewall. (through the WSC api) 项目地址: https://gitcode.com/GitHub_Trending/no/no-defender 当你的Windo…

2026/5/28 0:04:54 阅读更多

施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录

更多请点击： https://codechina.net 第一章：施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录在华北某大型地铁盾构施工现场，一套轻量化AI Agent系统于2024年Q2完成全栈部署&#xff…

2026/5/27 3:41:47 阅读更多

附录 B：术语表

本术语表面向“从 MM 到 HMM”专栏阅读过程中的快速查阅。它不是内核 API 手册，而是把文章中反复出现的概念放到同一张地图上：先给出直观含义，再说明它在 Linux MM/HMM 语境里的作用。建议阅读方式： 初读专栏时，把它当…

2026/5/27 3:04:04 阅读更多

Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表·行业首曝）

更多请点击： https://kaifayun.com 第一章：Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表行业首曝） Midjourney 的渐变美学并非传统插值实现，而是由其隐式神经渲染器（Implicit Neu…

2026/5/27 2:28:22 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/27 20:16:23 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/27 15:51:09 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/27 12:55:08 阅读更多

相关文章