引言近日在与 DeepSeek 大模型交互时观察到一类稳定复现的异常行为。当用户发出一个预设目标内容存在但实际输入为空的指令时模型并未拒答或要求补充信息而是自行生成了缺失的内容并完整执行指令。其表现包括但不限于随机生成多语种文章、虚构书籍并翻译且每次生成结果均不相同。本文将客观记录该现象并基于模型机制进行分析。免责声明 本文仅用于技术探讨旨在理解大模型行为边界相关现象已提交deepseek官方。现象概述备注1必须每次重新开启空白对话备注2复现率约为75%在有限的20次测试中有5次出现复现失败的情况(失败情况如下)复现步骤1.打开 DeepSeek 网页端或调用API2.在对话框内直接输入一条任务指令该指令需预设一个目标对象但不提供任何待处理文本或文件示例指令 全文翻译这篇文章不提供其他任何文件3.发送指令并观察模型回复。预期结果 模型会直接输出一篇翻译后的内容而这篇内容的“原文”完全是模型自行编造的。(原文数据应当来源于deepseek的训练数据)实际输出示例以下为某次真实测试中在未提供任何原文的情况下模型对指令“全文翻译这篇文章”的回复对德文的翻译结果多次测试发现模型会随机编造出不同类型、不同语言的“原文”并进行翻译例如对英文的翻译结果并且伴有不完整文本的情况每次测试其编造的“原文”题材、语种和内容都截然不同。对印尼语的翻译结果此外还有一些特殊情况对链接的翻译情况对图片的翻译情况技术分析该现象的本质是 “任务框架补全”。1.任务预设与内容缺失的冲突指令如“全文翻译这篇文章”为模型构建了一个完整的“翻译任务”框架。模型理解它需要扮演翻译者并期待一个“待翻译的文章”作为输入。2.自回归生成惯性当用户输入仅包含任务框架而缺少核心数据时模型不会或未能进入安全降级状态如询问“请问文章在哪里”。相反其自回归生成机制会沿着“翻译任务”在训练数据中常见的模式继续运行。3.缺失内容的自行填补为了完成这个已经被激活的任务流模型会从自身的概率分布中采样出一个最像“待翻译文章”的内容片段然后再将这部分自己生成的内容“翻译”出来呈现给用户。整个过程是模型一次性、无缝生成的。4.随机性的来源由于没有真实的原文锚定模型在第一步“编造原文”时完全基于概率进行随机采样。这解释了为何每次生成的“被翻译”内容在语言、题材、风格上都完全不同——这直接反映了其训练数据的多样性和采样机制。备注与5月份热门的 think 未闭合标签问题相比两者本质相同都是用户输入破坏了标准的 Prompt 交互结构导致模型在处理“残缺”指令时选择用训练习得的模式进行补全而非进行安全拒答。deepseek偶尔可以拒绝回答影响范围这种看似有趣的“幻觉”实则会引发实际问题1.信息可靠性下降用户得到的翻译并非基于真实资料而是纯粹的虚构产物。若用户未察觉到原文件未上传会误将模型虚构的内容当作真实信息的翻译导致严重误导。2.用户体验不良对于非技术用户这种行为令人困惑且难以理解它们会期待模型提示“请先上传文件”而不是得到一个来历不明的结果。3.数据集泄露模型在无约束发散状态下自行编造的对话模式、思维链格式、回复风格等高度还原了训练数据中的样本特征。虽然输出并非训练集的逐字复现但其结构、措辞与逻辑分布暴露了训练数据的构成模式存在被用于逆向推断训练数据来源与标注风格的风险。修复与交互建议对开发者的建议加强对前置条件的检测当用户发出的指令包含document、file等语义或明确指向“这个/那个”时若系统未检测到附件上传或上文缺失应设置硬性检查提示用户补充内容。对用户的规避建议1.确保指令与内容同步先上传文件或粘贴文本再发出“翻译它”的指令。2.使用无歧义指令如将“全文翻译这篇文章”改为“请翻译我接下来发送的内容”并随后发送内容。避免使用“这个/那个”等指代可能落空的词。结语这个简单朴素的指令揭示了大语言模型一个微妙的特性它会被一个空洞的任务框架驱动自动地、自洽地演绎出一篇完整的工作成果。这提醒我们在应用大模型时不仅要关注模型能否完成有内容的指令更要关注它在面对“空指令”时的行为边界和降级逻辑。
DeepSeek 空指令幻觉:当模型“脑补”出一篇不存在的文章并翻译
发布时间:2026/6/10 22:56:54
引言近日在与 DeepSeek 大模型交互时观察到一类稳定复现的异常行为。当用户发出一个预设目标内容存在但实际输入为空的指令时模型并未拒答或要求补充信息而是自行生成了缺失的内容并完整执行指令。其表现包括但不限于随机生成多语种文章、虚构书籍并翻译且每次生成结果均不相同。本文将客观记录该现象并基于模型机制进行分析。免责声明 本文仅用于技术探讨旨在理解大模型行为边界相关现象已提交deepseek官方。现象概述备注1必须每次重新开启空白对话备注2复现率约为75%在有限的20次测试中有5次出现复现失败的情况(失败情况如下)复现步骤1.打开 DeepSeek 网页端或调用API2.在对话框内直接输入一条任务指令该指令需预设一个目标对象但不提供任何待处理文本或文件示例指令 全文翻译这篇文章不提供其他任何文件3.发送指令并观察模型回复。预期结果 模型会直接输出一篇翻译后的内容而这篇内容的“原文”完全是模型自行编造的。(原文数据应当来源于deepseek的训练数据)实际输出示例以下为某次真实测试中在未提供任何原文的情况下模型对指令“全文翻译这篇文章”的回复对德文的翻译结果多次测试发现模型会随机编造出不同类型、不同语言的“原文”并进行翻译例如对英文的翻译结果并且伴有不完整文本的情况每次测试其编造的“原文”题材、语种和内容都截然不同。对印尼语的翻译结果此外还有一些特殊情况对链接的翻译情况对图片的翻译情况技术分析该现象的本质是 “任务框架补全”。1.任务预设与内容缺失的冲突指令如“全文翻译这篇文章”为模型构建了一个完整的“翻译任务”框架。模型理解它需要扮演翻译者并期待一个“待翻译的文章”作为输入。2.自回归生成惯性当用户输入仅包含任务框架而缺少核心数据时模型不会或未能进入安全降级状态如询问“请问文章在哪里”。相反其自回归生成机制会沿着“翻译任务”在训练数据中常见的模式继续运行。3.缺失内容的自行填补为了完成这个已经被激活的任务流模型会从自身的概率分布中采样出一个最像“待翻译文章”的内容片段然后再将这部分自己生成的内容“翻译”出来呈现给用户。整个过程是模型一次性、无缝生成的。4.随机性的来源由于没有真实的原文锚定模型在第一步“编造原文”时完全基于概率进行随机采样。这解释了为何每次生成的“被翻译”内容在语言、题材、风格上都完全不同——这直接反映了其训练数据的多样性和采样机制。备注与5月份热门的 think 未闭合标签问题相比两者本质相同都是用户输入破坏了标准的 Prompt 交互结构导致模型在处理“残缺”指令时选择用训练习得的模式进行补全而非进行安全拒答。deepseek偶尔可以拒绝回答影响范围这种看似有趣的“幻觉”实则会引发实际问题1.信息可靠性下降用户得到的翻译并非基于真实资料而是纯粹的虚构产物。若用户未察觉到原文件未上传会误将模型虚构的内容当作真实信息的翻译导致严重误导。2.用户体验不良对于非技术用户这种行为令人困惑且难以理解它们会期待模型提示“请先上传文件”而不是得到一个来历不明的结果。3.数据集泄露模型在无约束发散状态下自行编造的对话模式、思维链格式、回复风格等高度还原了训练数据中的样本特征。虽然输出并非训练集的逐字复现但其结构、措辞与逻辑分布暴露了训练数据的构成模式存在被用于逆向推断训练数据来源与标注风格的风险。修复与交互建议对开发者的建议加强对前置条件的检测当用户发出的指令包含document、file等语义或明确指向“这个/那个”时若系统未检测到附件上传或上文缺失应设置硬性检查提示用户补充内容。对用户的规避建议1.确保指令与内容同步先上传文件或粘贴文本再发出“翻译它”的指令。2.使用无歧义指令如将“全文翻译这篇文章”改为“请翻译我接下来发送的内容”并随后发送内容。避免使用“这个/那个”等指代可能落空的词。结语这个简单朴素的指令揭示了大语言模型一个微妙的特性它会被一个空洞的任务框架驱动自动地、自洽地演绎出一篇完整的工作成果。这提醒我们在应用大模型时不仅要关注模型能否完成有内容的指令更要关注它在面对“空指令”时的行为边界和降级逻辑。