“上下文塑造”演示:成本与效果并存,干预策略成关键! “上下文塑造”想法的起源2026年6月5日软件开发人员阅读了VivVtrivedy10撰写的《代理约束装置剖析》文章对“约束装置”概念进行了很好的概述。阅读时开发者产生让模型检查并修改上下文窗口本身的想法。自ChatGPT发布后将上下文窗口视为只能追加内容的对话历史的观念已根深蒂固开发者思考摒弃这一假设的可能性。“上下文塑造”方法的确定开发者和Claude探讨后决定采用让大模型观察并编辑小模型上下文窗口的方法Claude为该想法提名称建议开发者最终选择“上下文塑造”。开发者琢磨想法期间看到Anthropic发布“顾问策略”内容且读Viv文章时思考递归语言模型RLMs这些都对“上下文塑造”想法有影响。“氛围研究”的开展开发者决定验证想法从幻想严谨实验转向小型“工程案例研究”即“氛围研究”。和Claude制定计划旨在解决允许模型重写另一模型工作上下文会怎样的问题建议用Pi代理约束装置框架构建自定义约束装置Claude赞同。将能力强的模型称为“外部代理”小模型称为“内部代理”后用Codex进行实现和实验运行。项目架构与演示设置约束装置是简单两层循环外部代理从四个动作中选一个。演示目标是测试约束装置能否对上下文塑造进行可信可检查演示使用代码修复和本地语料库合成两个小任务。开发者对每个任务分别进行两次仅用内部代理和两次用完整约束装置的运行设置防护栏。第一次演示结果从高层次看演示顺利完成但使用完整约束装置运行成本是仅用内部代理的14倍且外部代理未编辑内部代理上下文窗口。外部代理像保守监督者从工程角度完整“上下文塑造”约束装置更差但从研究角度有一定意义。第二次演示调整与结果开发者对第一次演示结果不满意对演示做两处更改Codex降低内部代理模型能力进行“有针对性干预”演示。此次演示外部模型进行了上下文塑造合成任务是“最佳运行案例”代码修复任务是“失败案例”使用完整约束装置运行成本比仅用内部代理高70倍。结论与思考Codex得出干预策略重要性和“提示就是策略”两个结论。开发者认为这是值得研究的领域目前只能追加内容的对话历史方法可能仍为主流未来会继续思考并进行更多“氛围研究”。开发者还公开了相关代码和文档仓库。