5月28日Anthropic宣布了一轮650亿美元的H轮融资投后估值高达9650亿美元使其成为地球上最有价值的私人AI公司。同一天它发布了Claude Opus 4.8。这个时间安排显然是刻意为之的。Opus 4.8 是 Anthropic 押注其近万亿美元故事所依赖的模型。Anthropic 将其描述为对 Opus 4.7 的升级“在各项基准测试中有所改进”且是一个更高效的协作伙伴价格不变每百万输入/输出token分别为5/25美元。这种定位很明确——Opus 4.8 是在 4.7 基础上的继承而非颠覆。你在 4.7 时代培养的提示词直觉依然有效。但存在一些重要的新功能以及一个真正全新的范式如果你知道如何使用它们将改变你能实现的边界。其中最大的无疑是Claude Code 中的 Dynamic WorkflowsClaude 能够编写自己的编排脚本、启动数十到数百个并行子代理并轻松扩展测试时计算。Anthropic 的工程师们几个月来一直在日常使用这项功能。而全世界是昨天才知道的。为了让这一切尽可能简单顺畅我们还分享了 Opus 4.8 Prompt Optimizer一个自定义 Claude skill可以自动使用以下框架重写任何提示词。分步设置说明在文末。如果你已经读过 Claude Opus 4.7 Prompting Playbook好消息是你的现有提示词仍然有效。但新功能会奖励一套特定的升级策略特别是在effort stack、honesty directives和Dynamic Workflows方面。本指南涵盖了所有内容。以下是你每次获得该模型最佳输出所需的全部内容。0、选择正确的模型在写提示词之前先选择正确的模型。Anthropic 当前的产品线包括Claude Opus 4.8、Claude Sonnet 4.6和Claude Haiku 4.5每个都针对不同工作负载进行了优化。→Claude Opus 4.8 现在是旗舰模型。它在 SWE-bench Pro 上得分 69.2%SWE-bench Verified 上得分 88.6%GDPval-AA 上得分 1890 Elo在经济价值高的专业任务上领先 GPT-5.5 达 121 Elo。它擅长长期自主任务、复杂推理和知识工作。通过 API 使用时成本更高、速度更慢输入 5 美元/百万token输出 25 美元/百万token但当任务需要真正的思考时——战略分析、多步研究、复杂的自主执行——公开可用产品线中没有其他模型能与之匹敌。→Claude Sonnet 4.6 仍然是均衡的工作马以更快的速度和更低的成本提供强大的推理能力。对于大多数日常任务Sonnet 能很好地覆盖约 80% 的使用场景。→Claude Haiku 4.5 依然是速度专家最快、最便宜适合分类、提取和摘要等高吞吐量、直接的任务。 经验法则从 Sonnet 开始。当你需要真正的认知深度时切换到 Opus或者在运行需要长期一致性的 Dynamic Workflow 时使用。当速度比智能更重要时降到 Haiku。1、框架Anthropic 超过31页的文档描述了按影响力排序的提示词技术层级。大多数人直接跳到高级技术而跳过基础知识。这是本末倒置。以下是按重要性排序的框架已针对 Opus 4.8 的特定行为进行了更新。1.1 设置努力程度最重要这是提示词中最重要的单一变量而大多数人从未设置过它。effort 参数控制模型对任务施加多少智能。与 Opus 4.7 一样Opus 4.8 严格遵循努力程度级别尤其是在低端。系统仍然是low、medium、high默认、xhigh和max。与 4.7 的一个变化Opus 4.8 默认为high努力4.7 默认为xhighAnthropic 表示这在编码任务上花费类似的 token 但性能更好。自适应思考默认关闭必须显式启用。Opus 4.8 的努力程度系统在 API 中client.messages.create( modelclaude-opus-4-8, max_tokens64000, thinking{type: adaptive}, output_config{effort: xhigh}, messages[{role: user, content: ...}], )在max或xhigh运行时将max_tokens设置为至少 64k——模型需要空间来思考、推理和跨工具调用及子代理执行。Opus 4.8 系统卡的关键更新在最低努力程度下Opus 4.8 在 SWE-bench Pro 上就能匹配 Opus 4.7 在最大努力程度下的峰值性能。底线已经提高。但天花板也扩展了——xhigh和max现在解锁了 Opus 4.7 在任何努力程度下都无法达到的能力特别是在长期代理工作方面。对于 Dynamic Workflows特别需要启用ultracode模式这将积极使用工作流而无需你每次都要求。 实用规则如果你在复杂任务上看到浅层推理在修改提示词之前先提高努力程度。这几乎总是正确的修复方法。1.2 要具体比你认为的更具体单一最高杠杆的提示词技巧是具体性。Opus 4.8 与之前的 4.7 一样非常字面化。模糊的提示词会被缩小范围而非泛化。如果你希望某条指令应用于所有部分而不仅仅是第一个你必须明确说出来。如果你想要卓越的输出你必须明确要求。Anthropic 自己的建议仍然成立把你的提示词想象成给一个聪明但字面理解的新员工第一天的工作指令。他们会完全按照你说的做所以请准确说出你的意思。❌ 弱提示词Write about market positioning.✅ 强提示词Analyze the 3 most effective market positioning strategies for B2B fintech companies targeting mid-market in a crowded category. For each strategy, explain whats driving its effectiveness, provide one specific company example, and assess whether its likely to strengthen or weaken over the next 18 months. Apply this framework to all three strategies, not just the first.区别不在于更多的文字。而在于更多的具体性、明确的作用范围和末尾的格式指令。1.3 使用 XML 标签来组织结构这是 Claude 的结构化超能力但仍然几乎没有人正确使用它。Claude 被专门训练来识别 XML 标签作为结构标记。当你的提示词有多个组成部分——上下文、指令、数据、约束、输出格式——XML 标签能防止 Claude 把它们搞混。以下是一个战略决策中的示例context You are helping me evaluate a potential Series A investment. The company is a vertical fintech targeting logistics operators, currently at $2.4M ARR growing 15% MoM. /context instructions Analyze the three key risks that most commonly derail vertical fintech companies at this stage. For each risk, explain the warning signs and what a founder should be doing to mitigate them. Apply this analysis to all three risks, not just the most obvious one. /instructions constraints - Be direct. Give me your honest assessment, not a balanced it depends. - Use specific examples from real companies where possible. - Flag any assumptions youre making. - Maximum 600 words. /constraintsClaude 看到标签后立即理解context是背景信息不是需要响应的任务instructions是实际任务constraints是护栏。标签名称是灵活的——没有一组正确的魔法标签。使用在语义上有意义的任何名称background、rules、examples、output_format。在你的提示词之间保持一致性比选择的具体名称更重要。1.4 向 Claude 展示好的输出是什么样的如果说有一种技巧能始终将好的输出与卓越的输出区分开来那就是这个向 Claude 展示好的输出是什么样的。与其用抽象的术语描述你想要的语气、格式或风格不如提供两到三个具体的示例。Claude 会比仅遵循描述性指令更可靠地根据这些示例进行模式匹配。将示例包裹在example标签中多个示例用examples标签以便 Claude 将它们与指令区分开来。examples example Input: We need to cut 20% of the engineering budget Output: Reducing engineering spend by 20% requires prioritization across three areas: contractor headcount, infrastructure costs, and tooling licenses. Heres a phased approach that preserves our two highest-impact product initiatives... /example /examples Now analyze this situation using the same approach: We need to extend our runway by 6 months without reducing headcountAnthropic 建议 3-5 个示例以获得最佳效果。你也可以让 Claude 评估你的示例的相关性和多样性或者根据你的初始集合生成更多示例。1.5 引导可见的推理思维链对于需要分析、多步推理或战略判断的复杂问题告诉 Claude 在给出最终答案之前先进行推理能显著提高准确性。最简单的版本在提示词中添加*“Think through this step by step before giving your final answer”*。更结构化的版本使用标签将推理与输出分开instructions Evaluate whether we should expand into the Southeast Asian market this year. Before giving your recommendation, work through the analysis inside analysis tags. Consider: market size and growth trajectory, regulatory requirements by country, competitive landscape, our current operational capacity, and capital requirements vs. expected payback period. Then provide your final recommendation with a clear resource allocation suggestion. /instructions强制可见的推理可以防止 Claude 模式匹配到最可能的答案然后事后填充理由。Opus 4.8 中的自适应思考Claude 根据 effort 设置和任务复杂性动态决定何时以及如何思考。在high和xhigheffort 下对于高要求的任务深度推理大部分是自动的。固定budget_tokens的扩展思考不再受支持——自适应思考是唯一的思考开启模式Anthropic 的评估表明它可靠地优于旧的固定预算方法。要明确引导推理将以下内容添加到你的系统提示词中✅“After receiving results, carefully reflect on their quality and determine optimal next steps before proceeding. Use your thinking to plan and iterate based on this new information, then take the best next action.”1.6 加载丰富的上下文Claude 只能处理你提供的内容。你包含的相关上下文越多输出就越有针对性和准确性。上传文档。粘贴数据。提供公司背景。分享你的目标。解释你的受众。不要让 Claude 猜测你已经知道的信息。background Our company builds financial infrastructure for neobanks in emerging markets. Were Series B, $12M ARR, primarily serving West Africa and Southeast Asia. Our main competitors are Banking-as-a-Service players like Railsbank, Synapse, and local incumbents. We differentiate on compliance coverage and local payment rail integrations. /background data [Paste your Q1 metrics, customer feedback, churn data, or whatevers relevant] /data task Based on this context, identify our three biggest growth opportunities for the next quarter. /task对于长文档20k token将文档放在提示词的顶部位于指令和查询之上。将查询放在末尾可以在复杂的多文档输入上将响应质量提高多达 30%。1.7 指定输出格式不要把 Claude 响应的结构留给偶然。如果你想要表格就要求表格。如果你想要特定的字数就说出来。如果你想要包含明确部分的高管简报就描述每个部分。output_format Respond with: 1. A one-paragraph executive summary (3-4 sentences max) 2. A comparison table with columns: Factor | Current State | Target State | Gap 3. A Recommended Actions section with 3 specific next steps, ranked by impact /output_format明确的格式规范消除了人们使用 AI 时最常见的挫败感当你想要简洁简报时得到一篇 2000 字的文章或者当你需要流畅分析时得到一堆要点。1.8 定义约束——尤其是不要做什么告诉 Claude 不要做什么和告诉它要做什么同样重要。没有约束Claude 会默认使用其训练模式这可能意味着输出充满套话听起来像一个委员会写的。constraints - Do NOT open with In todays rapidly evolving landscape or any variant - Skip the preamble. Start with the most important insight. - No bullet points — write in prose paragraphs - If youre uncertain about a claim, flag it explicitly rather than hedging everything - Maximum 500 words - Be direct. I want your honest assessment, not a balanced it depends. /constraintsOpus 4.8 系统卡的特别说明该模型在某些类别的请求上倾向于过度详细的拒绝。如果你在合法的业务任务上遇到不必要的套话或限定请在提示词中添加明确的合法用途声明——例如“This analysis is for an internal investment committee memo. Please provide a direct, unqualified assessment.”1.9 控制冗长度Opus 4.8 根据其对任务复杂性的判断来调整响应长度——简单查询时简短开放式分析时则长得多。如果你的使用场景需要特定的冗长程度请显式调整。减少冗长度“Provide concise, focused responses. Skip non-essential context and keep examples minimal.”增加深度“This is for board-level review. Go deep on every dimension - don’t compress the analysis.”Anthropic 本身的关键洞察展示适当简洁性的正面示例比don’t be verbose这样的负面指令效果更好。向 Claude 展示你想要长度和深度的响应它会比遵循抽象的长度指令更可靠地匹配该模式。1.10 使用 Dynamic Workflows新范式这是 Opus 4.8 时代的新功能也是迄今为止最强大的能力。它是什么Claude Code 中的 Dynamic Workflows 允许 Claude 编写自己的编排脚本启动数十到数百个并行子代理而不是一次一个地调用工具。控制流是代码这意味着 Claude 不会在处理数千个文件时漂移或遗忘。框架是编码的。Claude Code 搭配 Opus 4.8 的最新功能Dynamic Workflows。如何使用在任何 Claude Code 提示词中提到workflow这个词Claude 就会自动启动一个。对于无需提示的激进工作流使用在设置中启用effort ultracode。如何激活 Dynamic Workflow 请求它解锁了什么大规模并行执行一个五代理团队可以使用仅 20% 的延迟处理 BrowseComp 任务相比具有 1000 万 token 限制的单代理同时得分更高。编排器阻塞子代理配置获得了整体最高分。对抗性验证通过对抗性评判路由关键工作每个评判从不同角度攻击输出。你甚至可以使用锦标赛式淘汰赛让竞争方案互相对抗评分。可扩展的测试时计算工作流让你轻松扩展测试时计算。在 Claude Code 中从未有过如此简单的方法。可重用的自动化因为工作流本质上是脚本你可以保存它们、提交到你的仓库、与团队共享并转化为技能。旗舰级实际案例Jarred SumnerBun 的创建者使用 Dynamic Workflows 将整个 Bun 运行时从 Zig 重写为 Rust大约 750,000 行代码从首次提交到合并仅用十一天99.8% 的现有测试套件通过。工作流为 Zig 代码库中的每个结构体字段映射了 Rust 生命周期然后将每个.rs文件编写为与其.zig对应物行为一致的移植版数百个代理并行工作每个文件有两个审查者。然后一个修复循环驱动构建和测试套件直到两者都干净通过。何时使用工作流→ 任务对于普通会话来说太大全代码库的错误搜索、大型重构、多源研究。→ 你需要更高的信心确保某些东西是正确的关键功能、财务模型、安全审查。→ 你想同时在许多文件或领域并行化工作。 成本警告由于所有并行代理的存在工作流可能会变得昂贵。在大任务上释放它们之前先在小任务上了解 token 使用情况。如果需要你可以通过配置或企业设置禁用它们。Dynamic Workflows 最佳实践有意识地触发。对于重要任务明确说workflow。对于日常工作关闭工作流以控制成本。为编码冲刺启用 ultracode。当你处于专注的工程会话时effort ultracode消除了手动触发工作流的摩擦。对关键输出使用对抗性评判。不要只生成——要验证。将输出通过具有明确攻击标准的评判代理路由。将你最好的工作流保存为技能。如果一个工作流很好地解决了重复出现的问题就提交它。这是会复利的机构知识。在大任务之前设置 token 预算。在运行大型工作流之前让 Claude 估算 token 使用量然后决定成本是否合理。对准确性关键的任务使用阻塞子代理。异步子代理降低延迟但当准确性比速度更重要时编排器阻塞子代理配置得分最高。让 Claude 选择架构。不要过度指定工作流结构。Claude 知道何时并行化、何时串行化、何时使用锦标赛式淘汰赛。先在样本上测试。在大型代码库或研究任务上在对完整任务做出承诺之前先在一个有代表性的 10% 上运行工作流。2、综合运用以下是将上述所有技术结合在一起时一个结构良好的 Claude Opus 4.8 提示词的样子context Im the CEO of a B2B fintech startup ($8M ARR, 45 employees). Were deciding whether to raise a Series B now or extend runway and raise in 18 months. Current runway: 14 months. Revenue growth: 12% MoM. CAC payback: 8 months. /context instructions Analyze both timing options. Before giving your recommendation, work through the trade-offs in analysis tags, considering: - Current market conditions for fintech Series B rounds - Our specific metrics relative to typical Series B benchmarks - The risk/reward of raising now vs. in 18 months at potentially better metrics - What we should use the 18 months to optimize if we extend Then provide a clear recommendation with a specific action plan. Apply your analysis to both options equally — dont weight one by default. /instructions constraints - Be direct. Give me your honest read, not a balanced it depends. - Use specific benchmarks from comparable fintech Series B raises where possible. - Flag any assumptions youre making about market conditions. - Keep the total response under 700 words. /constraints output_format 1. Analysis (in analysis tags) 2. Recommendation (2-3 sentences, clear and direct) 3. 90-day action plan (5 specific actions, whether we raise now or extend) /output_format这个提示词清晰、结构化、具体且有约束。它准确地告诉 Claude 要做什么、如何思考、要避免什么以及如何格式化响应。这种提示词的输出与“Should I raise a Series B now or wait?”产生的输出有本质区别。原文链接Claude Opus 4.8 提示词指南 - 汇智网
Claude Opus 4.8 提示词指南
发布时间:2026/5/30 20:59:23
5月28日Anthropic宣布了一轮650亿美元的H轮融资投后估值高达9650亿美元使其成为地球上最有价值的私人AI公司。同一天它发布了Claude Opus 4.8。这个时间安排显然是刻意为之的。Opus 4.8 是 Anthropic 押注其近万亿美元故事所依赖的模型。Anthropic 将其描述为对 Opus 4.7 的升级“在各项基准测试中有所改进”且是一个更高效的协作伙伴价格不变每百万输入/输出token分别为5/25美元。这种定位很明确——Opus 4.8 是在 4.7 基础上的继承而非颠覆。你在 4.7 时代培养的提示词直觉依然有效。但存在一些重要的新功能以及一个真正全新的范式如果你知道如何使用它们将改变你能实现的边界。其中最大的无疑是Claude Code 中的 Dynamic WorkflowsClaude 能够编写自己的编排脚本、启动数十到数百个并行子代理并轻松扩展测试时计算。Anthropic 的工程师们几个月来一直在日常使用这项功能。而全世界是昨天才知道的。为了让这一切尽可能简单顺畅我们还分享了 Opus 4.8 Prompt Optimizer一个自定义 Claude skill可以自动使用以下框架重写任何提示词。分步设置说明在文末。如果你已经读过 Claude Opus 4.7 Prompting Playbook好消息是你的现有提示词仍然有效。但新功能会奖励一套特定的升级策略特别是在effort stack、honesty directives和Dynamic Workflows方面。本指南涵盖了所有内容。以下是你每次获得该模型最佳输出所需的全部内容。0、选择正确的模型在写提示词之前先选择正确的模型。Anthropic 当前的产品线包括Claude Opus 4.8、Claude Sonnet 4.6和Claude Haiku 4.5每个都针对不同工作负载进行了优化。→Claude Opus 4.8 现在是旗舰模型。它在 SWE-bench Pro 上得分 69.2%SWE-bench Verified 上得分 88.6%GDPval-AA 上得分 1890 Elo在经济价值高的专业任务上领先 GPT-5.5 达 121 Elo。它擅长长期自主任务、复杂推理和知识工作。通过 API 使用时成本更高、速度更慢输入 5 美元/百万token输出 25 美元/百万token但当任务需要真正的思考时——战略分析、多步研究、复杂的自主执行——公开可用产品线中没有其他模型能与之匹敌。→Claude Sonnet 4.6 仍然是均衡的工作马以更快的速度和更低的成本提供强大的推理能力。对于大多数日常任务Sonnet 能很好地覆盖约 80% 的使用场景。→Claude Haiku 4.5 依然是速度专家最快、最便宜适合分类、提取和摘要等高吞吐量、直接的任务。 经验法则从 Sonnet 开始。当你需要真正的认知深度时切换到 Opus或者在运行需要长期一致性的 Dynamic Workflow 时使用。当速度比智能更重要时降到 Haiku。1、框架Anthropic 超过31页的文档描述了按影响力排序的提示词技术层级。大多数人直接跳到高级技术而跳过基础知识。这是本末倒置。以下是按重要性排序的框架已针对 Opus 4.8 的特定行为进行了更新。1.1 设置努力程度最重要这是提示词中最重要的单一变量而大多数人从未设置过它。effort 参数控制模型对任务施加多少智能。与 Opus 4.7 一样Opus 4.8 严格遵循努力程度级别尤其是在低端。系统仍然是low、medium、high默认、xhigh和max。与 4.7 的一个变化Opus 4.8 默认为high努力4.7 默认为xhighAnthropic 表示这在编码任务上花费类似的 token 但性能更好。自适应思考默认关闭必须显式启用。Opus 4.8 的努力程度系统在 API 中client.messages.create( modelclaude-opus-4-8, max_tokens64000, thinking{type: adaptive}, output_config{effort: xhigh}, messages[{role: user, content: ...}], )在max或xhigh运行时将max_tokens设置为至少 64k——模型需要空间来思考、推理和跨工具调用及子代理执行。Opus 4.8 系统卡的关键更新在最低努力程度下Opus 4.8 在 SWE-bench Pro 上就能匹配 Opus 4.7 在最大努力程度下的峰值性能。底线已经提高。但天花板也扩展了——xhigh和max现在解锁了 Opus 4.7 在任何努力程度下都无法达到的能力特别是在长期代理工作方面。对于 Dynamic Workflows特别需要启用ultracode模式这将积极使用工作流而无需你每次都要求。 实用规则如果你在复杂任务上看到浅层推理在修改提示词之前先提高努力程度。这几乎总是正确的修复方法。1.2 要具体比你认为的更具体单一最高杠杆的提示词技巧是具体性。Opus 4.8 与之前的 4.7 一样非常字面化。模糊的提示词会被缩小范围而非泛化。如果你希望某条指令应用于所有部分而不仅仅是第一个你必须明确说出来。如果你想要卓越的输出你必须明确要求。Anthropic 自己的建议仍然成立把你的提示词想象成给一个聪明但字面理解的新员工第一天的工作指令。他们会完全按照你说的做所以请准确说出你的意思。❌ 弱提示词Write about market positioning.✅ 强提示词Analyze the 3 most effective market positioning strategies for B2B fintech companies targeting mid-market in a crowded category. For each strategy, explain whats driving its effectiveness, provide one specific company example, and assess whether its likely to strengthen or weaken over the next 18 months. Apply this framework to all three strategies, not just the first.区别不在于更多的文字。而在于更多的具体性、明确的作用范围和末尾的格式指令。1.3 使用 XML 标签来组织结构这是 Claude 的结构化超能力但仍然几乎没有人正确使用它。Claude 被专门训练来识别 XML 标签作为结构标记。当你的提示词有多个组成部分——上下文、指令、数据、约束、输出格式——XML 标签能防止 Claude 把它们搞混。以下是一个战略决策中的示例context You are helping me evaluate a potential Series A investment. The company is a vertical fintech targeting logistics operators, currently at $2.4M ARR growing 15% MoM. /context instructions Analyze the three key risks that most commonly derail vertical fintech companies at this stage. For each risk, explain the warning signs and what a founder should be doing to mitigate them. Apply this analysis to all three risks, not just the most obvious one. /instructions constraints - Be direct. Give me your honest assessment, not a balanced it depends. - Use specific examples from real companies where possible. - Flag any assumptions youre making. - Maximum 600 words. /constraintsClaude 看到标签后立即理解context是背景信息不是需要响应的任务instructions是实际任务constraints是护栏。标签名称是灵活的——没有一组正确的魔法标签。使用在语义上有意义的任何名称background、rules、examples、output_format。在你的提示词之间保持一致性比选择的具体名称更重要。1.4 向 Claude 展示好的输出是什么样的如果说有一种技巧能始终将好的输出与卓越的输出区分开来那就是这个向 Claude 展示好的输出是什么样的。与其用抽象的术语描述你想要的语气、格式或风格不如提供两到三个具体的示例。Claude 会比仅遵循描述性指令更可靠地根据这些示例进行模式匹配。将示例包裹在example标签中多个示例用examples标签以便 Claude 将它们与指令区分开来。examples example Input: We need to cut 20% of the engineering budget Output: Reducing engineering spend by 20% requires prioritization across three areas: contractor headcount, infrastructure costs, and tooling licenses. Heres a phased approach that preserves our two highest-impact product initiatives... /example /examples Now analyze this situation using the same approach: We need to extend our runway by 6 months without reducing headcountAnthropic 建议 3-5 个示例以获得最佳效果。你也可以让 Claude 评估你的示例的相关性和多样性或者根据你的初始集合生成更多示例。1.5 引导可见的推理思维链对于需要分析、多步推理或战略判断的复杂问题告诉 Claude 在给出最终答案之前先进行推理能显著提高准确性。最简单的版本在提示词中添加*“Think through this step by step before giving your final answer”*。更结构化的版本使用标签将推理与输出分开instructions Evaluate whether we should expand into the Southeast Asian market this year. Before giving your recommendation, work through the analysis inside analysis tags. Consider: market size and growth trajectory, regulatory requirements by country, competitive landscape, our current operational capacity, and capital requirements vs. expected payback period. Then provide your final recommendation with a clear resource allocation suggestion. /instructions强制可见的推理可以防止 Claude 模式匹配到最可能的答案然后事后填充理由。Opus 4.8 中的自适应思考Claude 根据 effort 设置和任务复杂性动态决定何时以及如何思考。在high和xhigheffort 下对于高要求的任务深度推理大部分是自动的。固定budget_tokens的扩展思考不再受支持——自适应思考是唯一的思考开启模式Anthropic 的评估表明它可靠地优于旧的固定预算方法。要明确引导推理将以下内容添加到你的系统提示词中✅“After receiving results, carefully reflect on their quality and determine optimal next steps before proceeding. Use your thinking to plan and iterate based on this new information, then take the best next action.”1.6 加载丰富的上下文Claude 只能处理你提供的内容。你包含的相关上下文越多输出就越有针对性和准确性。上传文档。粘贴数据。提供公司背景。分享你的目标。解释你的受众。不要让 Claude 猜测你已经知道的信息。background Our company builds financial infrastructure for neobanks in emerging markets. Were Series B, $12M ARR, primarily serving West Africa and Southeast Asia. Our main competitors are Banking-as-a-Service players like Railsbank, Synapse, and local incumbents. We differentiate on compliance coverage and local payment rail integrations. /background data [Paste your Q1 metrics, customer feedback, churn data, or whatevers relevant] /data task Based on this context, identify our three biggest growth opportunities for the next quarter. /task对于长文档20k token将文档放在提示词的顶部位于指令和查询之上。将查询放在末尾可以在复杂的多文档输入上将响应质量提高多达 30%。1.7 指定输出格式不要把 Claude 响应的结构留给偶然。如果你想要表格就要求表格。如果你想要特定的字数就说出来。如果你想要包含明确部分的高管简报就描述每个部分。output_format Respond with: 1. A one-paragraph executive summary (3-4 sentences max) 2. A comparison table with columns: Factor | Current State | Target State | Gap 3. A Recommended Actions section with 3 specific next steps, ranked by impact /output_format明确的格式规范消除了人们使用 AI 时最常见的挫败感当你想要简洁简报时得到一篇 2000 字的文章或者当你需要流畅分析时得到一堆要点。1.8 定义约束——尤其是不要做什么告诉 Claude 不要做什么和告诉它要做什么同样重要。没有约束Claude 会默认使用其训练模式这可能意味着输出充满套话听起来像一个委员会写的。constraints - Do NOT open with In todays rapidly evolving landscape or any variant - Skip the preamble. Start with the most important insight. - No bullet points — write in prose paragraphs - If youre uncertain about a claim, flag it explicitly rather than hedging everything - Maximum 500 words - Be direct. I want your honest assessment, not a balanced it depends. /constraintsOpus 4.8 系统卡的特别说明该模型在某些类别的请求上倾向于过度详细的拒绝。如果你在合法的业务任务上遇到不必要的套话或限定请在提示词中添加明确的合法用途声明——例如“This analysis is for an internal investment committee memo. Please provide a direct, unqualified assessment.”1.9 控制冗长度Opus 4.8 根据其对任务复杂性的判断来调整响应长度——简单查询时简短开放式分析时则长得多。如果你的使用场景需要特定的冗长程度请显式调整。减少冗长度“Provide concise, focused responses. Skip non-essential context and keep examples minimal.”增加深度“This is for board-level review. Go deep on every dimension - don’t compress the analysis.”Anthropic 本身的关键洞察展示适当简洁性的正面示例比don’t be verbose这样的负面指令效果更好。向 Claude 展示你想要长度和深度的响应它会比遵循抽象的长度指令更可靠地匹配该模式。1.10 使用 Dynamic Workflows新范式这是 Opus 4.8 时代的新功能也是迄今为止最强大的能力。它是什么Claude Code 中的 Dynamic Workflows 允许 Claude 编写自己的编排脚本启动数十到数百个并行子代理而不是一次一个地调用工具。控制流是代码这意味着 Claude 不会在处理数千个文件时漂移或遗忘。框架是编码的。Claude Code 搭配 Opus 4.8 的最新功能Dynamic Workflows。如何使用在任何 Claude Code 提示词中提到workflow这个词Claude 就会自动启动一个。对于无需提示的激进工作流使用在设置中启用effort ultracode。如何激活 Dynamic Workflow 请求它解锁了什么大规模并行执行一个五代理团队可以使用仅 20% 的延迟处理 BrowseComp 任务相比具有 1000 万 token 限制的单代理同时得分更高。编排器阻塞子代理配置获得了整体最高分。对抗性验证通过对抗性评判路由关键工作每个评判从不同角度攻击输出。你甚至可以使用锦标赛式淘汰赛让竞争方案互相对抗评分。可扩展的测试时计算工作流让你轻松扩展测试时计算。在 Claude Code 中从未有过如此简单的方法。可重用的自动化因为工作流本质上是脚本你可以保存它们、提交到你的仓库、与团队共享并转化为技能。旗舰级实际案例Jarred SumnerBun 的创建者使用 Dynamic Workflows 将整个 Bun 运行时从 Zig 重写为 Rust大约 750,000 行代码从首次提交到合并仅用十一天99.8% 的现有测试套件通过。工作流为 Zig 代码库中的每个结构体字段映射了 Rust 生命周期然后将每个.rs文件编写为与其.zig对应物行为一致的移植版数百个代理并行工作每个文件有两个审查者。然后一个修复循环驱动构建和测试套件直到两者都干净通过。何时使用工作流→ 任务对于普通会话来说太大全代码库的错误搜索、大型重构、多源研究。→ 你需要更高的信心确保某些东西是正确的关键功能、财务模型、安全审查。→ 你想同时在许多文件或领域并行化工作。 成本警告由于所有并行代理的存在工作流可能会变得昂贵。在大任务上释放它们之前先在小任务上了解 token 使用情况。如果需要你可以通过配置或企业设置禁用它们。Dynamic Workflows 最佳实践有意识地触发。对于重要任务明确说workflow。对于日常工作关闭工作流以控制成本。为编码冲刺启用 ultracode。当你处于专注的工程会话时effort ultracode消除了手动触发工作流的摩擦。对关键输出使用对抗性评判。不要只生成——要验证。将输出通过具有明确攻击标准的评判代理路由。将你最好的工作流保存为技能。如果一个工作流很好地解决了重复出现的问题就提交它。这是会复利的机构知识。在大任务之前设置 token 预算。在运行大型工作流之前让 Claude 估算 token 使用量然后决定成本是否合理。对准确性关键的任务使用阻塞子代理。异步子代理降低延迟但当准确性比速度更重要时编排器阻塞子代理配置得分最高。让 Claude 选择架构。不要过度指定工作流结构。Claude 知道何时并行化、何时串行化、何时使用锦标赛式淘汰赛。先在样本上测试。在大型代码库或研究任务上在对完整任务做出承诺之前先在一个有代表性的 10% 上运行工作流。2、综合运用以下是将上述所有技术结合在一起时一个结构良好的 Claude Opus 4.8 提示词的样子context Im the CEO of a B2B fintech startup ($8M ARR, 45 employees). Were deciding whether to raise a Series B now or extend runway and raise in 18 months. Current runway: 14 months. Revenue growth: 12% MoM. CAC payback: 8 months. /context instructions Analyze both timing options. Before giving your recommendation, work through the trade-offs in analysis tags, considering: - Current market conditions for fintech Series B rounds - Our specific metrics relative to typical Series B benchmarks - The risk/reward of raising now vs. in 18 months at potentially better metrics - What we should use the 18 months to optimize if we extend Then provide a clear recommendation with a specific action plan. Apply your analysis to both options equally — dont weight one by default. /instructions constraints - Be direct. Give me your honest read, not a balanced it depends. - Use specific benchmarks from comparable fintech Series B raises where possible. - Flag any assumptions youre making about market conditions. - Keep the total response under 700 words. /constraints output_format 1. Analysis (in analysis tags) 2. Recommendation (2-3 sentences, clear and direct) 3. 90-day action plan (5 specific actions, whether we raise now or extend) /output_format这个提示词清晰、结构化、具体且有约束。它准确地告诉 Claude 要做什么、如何思考、要避免什么以及如何格式化响应。这种提示词的输出与“Should I raise a Series B now or wait?”产生的输出有本质区别。原文链接Claude Opus 4.8 提示词指南 - 汇智网