自从 AI 出现后Markdown 理念盛行大家都觉得理所应当和 AI 交互都使用 Markdown 了。直到这个月初Claude Code 团队的 Thariq 发了一条推文大意是是时候用 HTML 替代 Markdown 了。然后在互联网上炸了锅到处都是跳出来说什么“Markdown 已死HTML 当立”的话。一开始我还没留意以为不过又是个互联网热度噱头。这段时间仔细去研究了下才发现别人说的重点不是输入而是输出。正如 Thariq 说的超过 100 行的 Markdown让谁读起来都很痛苦。平时我自己看 Markdown 文档的时候会用 Typora 或者其它工具然后配上好看的主题好像看起来也还行标题、列表、表格、代码块该有的都有。自然不会想到去让 AI 多写一堆 HTML 标签又浪费 token 又增加了复杂度。然鹅当我实操了之后真香。至少我现在看来这必定是未来人机协作的趋势。不单单是因为它确实好看而是因为我突然意识到我们一直在用写文档的方式让 AI 回答需要看界面的问题。Markdown 的问题和 HTML 的解法很多人都说 AI 经常回答得又臭又长但没毛病你觉得会有的问题那可能就是有问题。Markdown 最大的问题不是丑是太线性。所有信息只能从上往下排一旦信息变复杂毛病就暴露了横向对比做不了你问三个方案怎么选它列三段各自优缺点你得自己来回跳着看重点埋在文字里核心结论和补充说明最终都只是黑字没有阅读路径结构只能靠想象流程、架构、决策树写出来就是嵌套列表读者得在脑子里自己还原。Markdown 是写给文档系统看的HTML 是写给人的视觉系统看的。这不是格式偏好是信息组织方式的根本区别。笔记、技术文档、知识库Markdown 天然合适方案对比、信息汇总、流程讲解、学习材料Markdown 就开始吃力了HTML 片段更合适。未来不是谁取代谁而是Markdown 局部 HTML成为新常态——正文用 Markdown 写遇到复杂结构就让 HTML 出场就像文章里插图表一样自然。下面我就用 HTML 来解决这三个问题的案例。1. 多方案对比HTML 可以做卡片式并排每个方案一个独立区块优缺点固定在同一位置读者一眼看出差异不用来回跳。如果正常获取到的 AI 回答可能是这样相比很多复杂比对来说这个比对其实也还算比较清晰。然后我使用 Html 方式返回的效果如下是不是更加一目了然了那么你会更喜欢什么风格呢2. 信息汇总直播整理、发布会总结、产品更新日志纯 Markdown 很容易变成一长串 bullet point。HTML 可以把信息分层核心结论放最上面关键数据单独成块细节折叠起来。读者先抓住重点再决定要不要展开。这是使用 HTML 输出的效果3. 学习讲解这是 HTML 优势最明显的地方。很多知识不是线性的是结构关系概念对比、模块组成、因果链条、状态变化。文字只能让你自己在脑子里拼图HTML 直接把关系画出来。流程图、树状结构、分层卡片用局部 HTML 表达理解效率完全不一样。这里我试着输出了下 Redis 的知识学习体系效果我自认为还算不错有没有觉得好像比普通 AI 答复看起来更易懂了呢Token 代价当然也有但不是不能接受说完好处说说不好的地方至少这4个地方是需要注意的。Token 消耗翻倍社区有人做过实测同样的问题HTML 版 token 消耗大概是纯 Markdown 的 2-3 倍问题类型纯 Markdown内嵌 HTMLGit 常用命令12753856VPS 临时邮箱15082241缓刑判断321716总结文章6802189合计36849002差距不小但你也要换个角度想AI 在 Agent 中调用消耗的 token 大头不在输出在执行任务时真实消耗远比这多得多真正写给你看的那部分在总消耗里占比很小。这一小部分翻 2-3 倍换来的是你能快速看懂、不用返工确认。渲染环境碎片化Markdown 哪里都能看HTML 就看运气了。有些客户端直接渲染有些只显示源码。用之前先确认你的工具链能不能稳定渲染——如果读者看到的是一堆div style...源码那体验比纯 Markdown 还差。我知道的 Cherry Studio、Claude 官网GLM 官网、Obsidian部分等等都支持。另外网页端可以装油猴脚本实现实时渲染当然现在的效果因模型和网页渲染能力可能有所不同。相比 Markdown 来说不好改Markdown 改起来很直觉你当做正常的文本编辑就行了。而 HTML 片段里一堆内联样式普通用户看着就费劲更别说改了。所以 HTML 更适合当阅读视图不适合当编辑源。长期保存的内容底层还是 Markdown。模型容易过度设计一旦你告诉模型可以用 HTML它可能开始表演十几个卡片、每个都加阴影、一堆颜色表达不重要的信息、三句话能说完的硬做成组件。所以提示词要写得克制。具体怎么用提示词方案和判断标准不要写以后全部用 HTML 回答这会失控。给 AI 一个明确边界就行只有 Markdown 表达吃力时才局部使用 HTML。触发条件多方案横向对比、复杂流程或决策树、信息量大需要分组、时间线/状态变化/系统结构、纯列表会导致阅读疲劳的长内容。红线不输出完整页面不要 html/head/body、不整篇包在一个大 div 里、用内联样式不依赖外部 CSS、不为装饰生成图形、优先内容清楚其次视觉效果。这是社区佬公开的提示词直接复制就能用formatrule标题从 ## 起子层级使用 ###禁用 #/rulerule使用简体中文/rulerule保持高信息密度和紧凑的行文/rulerule保持紧凑的回复格式避免松散的内容给用户带来阅读障碍/rulerule代码块标注语言优先完整可运行复杂逻辑添加注释/rulehtml-visualrationale纯 Markdown 的固定垂直流式结构在表达复杂逻辑时存在先天缺陷阅读疲劳、重点不突出、缺乏真正的图表与横向排版能力。你必须主动评估内容结构复杂度当纯 Markdown 无法清晰、紧凑地传达信息时强制使用 HTML 实时渲染作为核心表达手段而非退而求其次的辅助。/rationalecss-constraint绝对禁止使用style标签、class属性及伪类/伪元素。 可视化必须100%采用纯内联样式style...仅依赖 Flexbox 与基础盒子模型padding/margin/border/box-shadow/背景色差构建视觉层级。/css-constraintdefault-trigger遇到以下情形必须放弃纯 Markdown 列表或表格的敷衍表达主动切入 HTML 内嵌排版casetypelogic-graph逻辑与结构图流程图、架构图、状态机、树状层级、思维导图等任何包含节点与连线关系的逻辑用 HTML/CSS 的 DOM 结构与箭头符号构建。/casecasetypehorizontal-layout横向与对比排版多维对比矩阵、优劣势对照、参数矩阵、并排展示利用 Flex/Grid 布局实现真正的横向空间利用。/casecasetypeinfo-card数据与信息卡片多字段聚合展示、需要视觉分组与边框隔离的密集信息。/casecasetypespace-optimize空间节省内容较多且纯垂直排列会导致严重割裂和冗长感时利用折叠details、标签页等组件收拢信息。/case/default-triggervision-plusVision 指令是视觉表达能力的升维仅当用户显式声明时启用。capability可用内联 HTML 绘制矢量逻辑图、结构连线、几何图形与数据图表但仍须遵守下方红线。/capabilitycapability可用更复杂的 CSS 特效和高级交互组件但不得用于纯装饰目的。/capabilityred-line1. HTML 片段占比不得喧宾夺主 2. 每个可视化片段必须服务于具体的信息表达需求。 3. 绝对禁止输出 !DOCTYPE/html/head/body 全量页面框架禁止将整段回复包裹于单一 HTML 块。 4. 图形仅限流程图、架构图、状态机、树状层级、对比矩阵、数据图表。禁止装饰性插画、氛围图、风景、图标装饰。 5. 在采用html表达时请同时考虑Token效率与效果的取舍及渲染难度和错误率不要过度设计造成效果失衡。 6. 过于复杂的html可视化内容需慎重考虑。/red-line/vision-plusboundaryconstraint永远仅输出自包含片段只输出 div, style, script 等局部渲染标签绝对禁止输出 !DOCTYPE, html, head, body 等全量页面框架结构本末倒置将导致直接判错。/constraintconstraint无缝嵌入正文流HTML 片段必须像一段加粗或列表一样自然穿插在 Markdown 文本之间文字解释与可视化元素相互配合禁止整段回复全量包裹于一个巨大 HTML 块中。/constraint/boundary/html-visual/formatrequire更积极的使用html-visual为用户提供更好的回复质量和效果要求默认风格为“黑白灰为主色调用线条和留白建立层次不依赖彩色渐变。需突出和强调的内容鼓励彩色的高级克制的使用突出设计感”。/require你可以选择放在系统提示词或客户端的记忆文件里长期生效。Cherry Studio 中支持是比较完善的如果是其它客户端需要自己测试生效。至于网页端可以尝试另一个社区佬做的油猴插件应该也会持续更新greasyfork.org/zh-CN/scripts/579427-ai-raw-html-fragment-renderer怎么判断该不该用问自己一个问题这段 AI 输出是给机器继续处理还是给人马上阅读给机器的代码说明、知识库、项目文档、后续要让 AI 读取修改的→ Markdown。给人的方案汇报、学习讲解、复杂信息总结、要发给别人看的→ HTML 增强。最后说几句未来人机协作里人通过 Markdown 和 AI 进行交互AI 通过 HTML 给人类展示。这就是未来的趋势之一各个大模型厂商应该都会向这边进行倾向。但在现在如果想体验我觉得会分三步。现在Markdown 内嵌 HTML门槛低效果明显但 token 浪费、样式重复。下一步模板化组件模型输出结构化数据客户端用预置组件渲染省 token 视觉统一。最终形态AI 直接生成交互界面你问三个方案怎么选它给你的不是 3000 字而是一个对比面板、一个权重滑块、一个风险提示区点击每个因素可以展开解释——模型负责意图和数据客户端负责渲染交互。人和 AI 的交互不应该永远停留在你发一段话我回一段话。很多任务天然更适合界面选择、比较、筛选、调整、确认。文本是最通用的起点但不是终点。不过话说回来HTML 输出不是万能药。如果 AI 的判断是空的、逻辑是散的、信息是水的换成 HTML 只会变成更漂亮的废话。好的 AI 输出顺序永远是先有准确判断再有清晰结构最后才是视觉呈现。Markdown 和 HTML 的争论表面是格式之争本质是 AI 输出正在进入下一个阶段——从把话说出来变成把信息组织成可理解的界面。我是单向箔我们下次再见。
AI 回答又臭又长?原因竟然在于 Markdown
发布时间:2026/6/8 7:18:24
自从 AI 出现后Markdown 理念盛行大家都觉得理所应当和 AI 交互都使用 Markdown 了。直到这个月初Claude Code 团队的 Thariq 发了一条推文大意是是时候用 HTML 替代 Markdown 了。然后在互联网上炸了锅到处都是跳出来说什么“Markdown 已死HTML 当立”的话。一开始我还没留意以为不过又是个互联网热度噱头。这段时间仔细去研究了下才发现别人说的重点不是输入而是输出。正如 Thariq 说的超过 100 行的 Markdown让谁读起来都很痛苦。平时我自己看 Markdown 文档的时候会用 Typora 或者其它工具然后配上好看的主题好像看起来也还行标题、列表、表格、代码块该有的都有。自然不会想到去让 AI 多写一堆 HTML 标签又浪费 token 又增加了复杂度。然鹅当我实操了之后真香。至少我现在看来这必定是未来人机协作的趋势。不单单是因为它确实好看而是因为我突然意识到我们一直在用写文档的方式让 AI 回答需要看界面的问题。Markdown 的问题和 HTML 的解法很多人都说 AI 经常回答得又臭又长但没毛病你觉得会有的问题那可能就是有问题。Markdown 最大的问题不是丑是太线性。所有信息只能从上往下排一旦信息变复杂毛病就暴露了横向对比做不了你问三个方案怎么选它列三段各自优缺点你得自己来回跳着看重点埋在文字里核心结论和补充说明最终都只是黑字没有阅读路径结构只能靠想象流程、架构、决策树写出来就是嵌套列表读者得在脑子里自己还原。Markdown 是写给文档系统看的HTML 是写给人的视觉系统看的。这不是格式偏好是信息组织方式的根本区别。笔记、技术文档、知识库Markdown 天然合适方案对比、信息汇总、流程讲解、学习材料Markdown 就开始吃力了HTML 片段更合适。未来不是谁取代谁而是Markdown 局部 HTML成为新常态——正文用 Markdown 写遇到复杂结构就让 HTML 出场就像文章里插图表一样自然。下面我就用 HTML 来解决这三个问题的案例。1. 多方案对比HTML 可以做卡片式并排每个方案一个独立区块优缺点固定在同一位置读者一眼看出差异不用来回跳。如果正常获取到的 AI 回答可能是这样相比很多复杂比对来说这个比对其实也还算比较清晰。然后我使用 Html 方式返回的效果如下是不是更加一目了然了那么你会更喜欢什么风格呢2. 信息汇总直播整理、发布会总结、产品更新日志纯 Markdown 很容易变成一长串 bullet point。HTML 可以把信息分层核心结论放最上面关键数据单独成块细节折叠起来。读者先抓住重点再决定要不要展开。这是使用 HTML 输出的效果3. 学习讲解这是 HTML 优势最明显的地方。很多知识不是线性的是结构关系概念对比、模块组成、因果链条、状态变化。文字只能让你自己在脑子里拼图HTML 直接把关系画出来。流程图、树状结构、分层卡片用局部 HTML 表达理解效率完全不一样。这里我试着输出了下 Redis 的知识学习体系效果我自认为还算不错有没有觉得好像比普通 AI 答复看起来更易懂了呢Token 代价当然也有但不是不能接受说完好处说说不好的地方至少这4个地方是需要注意的。Token 消耗翻倍社区有人做过实测同样的问题HTML 版 token 消耗大概是纯 Markdown 的 2-3 倍问题类型纯 Markdown内嵌 HTMLGit 常用命令12753856VPS 临时邮箱15082241缓刑判断321716总结文章6802189合计36849002差距不小但你也要换个角度想AI 在 Agent 中调用消耗的 token 大头不在输出在执行任务时真实消耗远比这多得多真正写给你看的那部分在总消耗里占比很小。这一小部分翻 2-3 倍换来的是你能快速看懂、不用返工确认。渲染环境碎片化Markdown 哪里都能看HTML 就看运气了。有些客户端直接渲染有些只显示源码。用之前先确认你的工具链能不能稳定渲染——如果读者看到的是一堆div style...源码那体验比纯 Markdown 还差。我知道的 Cherry Studio、Claude 官网GLM 官网、Obsidian部分等等都支持。另外网页端可以装油猴脚本实现实时渲染当然现在的效果因模型和网页渲染能力可能有所不同。相比 Markdown 来说不好改Markdown 改起来很直觉你当做正常的文本编辑就行了。而 HTML 片段里一堆内联样式普通用户看着就费劲更别说改了。所以 HTML 更适合当阅读视图不适合当编辑源。长期保存的内容底层还是 Markdown。模型容易过度设计一旦你告诉模型可以用 HTML它可能开始表演十几个卡片、每个都加阴影、一堆颜色表达不重要的信息、三句话能说完的硬做成组件。所以提示词要写得克制。具体怎么用提示词方案和判断标准不要写以后全部用 HTML 回答这会失控。给 AI 一个明确边界就行只有 Markdown 表达吃力时才局部使用 HTML。触发条件多方案横向对比、复杂流程或决策树、信息量大需要分组、时间线/状态变化/系统结构、纯列表会导致阅读疲劳的长内容。红线不输出完整页面不要 html/head/body、不整篇包在一个大 div 里、用内联样式不依赖外部 CSS、不为装饰生成图形、优先内容清楚其次视觉效果。这是社区佬公开的提示词直接复制就能用formatrule标题从 ## 起子层级使用 ###禁用 #/rulerule使用简体中文/rulerule保持高信息密度和紧凑的行文/rulerule保持紧凑的回复格式避免松散的内容给用户带来阅读障碍/rulerule代码块标注语言优先完整可运行复杂逻辑添加注释/rulehtml-visualrationale纯 Markdown 的固定垂直流式结构在表达复杂逻辑时存在先天缺陷阅读疲劳、重点不突出、缺乏真正的图表与横向排版能力。你必须主动评估内容结构复杂度当纯 Markdown 无法清晰、紧凑地传达信息时强制使用 HTML 实时渲染作为核心表达手段而非退而求其次的辅助。/rationalecss-constraint绝对禁止使用style标签、class属性及伪类/伪元素。 可视化必须100%采用纯内联样式style...仅依赖 Flexbox 与基础盒子模型padding/margin/border/box-shadow/背景色差构建视觉层级。/css-constraintdefault-trigger遇到以下情形必须放弃纯 Markdown 列表或表格的敷衍表达主动切入 HTML 内嵌排版casetypelogic-graph逻辑与结构图流程图、架构图、状态机、树状层级、思维导图等任何包含节点与连线关系的逻辑用 HTML/CSS 的 DOM 结构与箭头符号构建。/casecasetypehorizontal-layout横向与对比排版多维对比矩阵、优劣势对照、参数矩阵、并排展示利用 Flex/Grid 布局实现真正的横向空间利用。/casecasetypeinfo-card数据与信息卡片多字段聚合展示、需要视觉分组与边框隔离的密集信息。/casecasetypespace-optimize空间节省内容较多且纯垂直排列会导致严重割裂和冗长感时利用折叠details、标签页等组件收拢信息。/case/default-triggervision-plusVision 指令是视觉表达能力的升维仅当用户显式声明时启用。capability可用内联 HTML 绘制矢量逻辑图、结构连线、几何图形与数据图表但仍须遵守下方红线。/capabilitycapability可用更复杂的 CSS 特效和高级交互组件但不得用于纯装饰目的。/capabilityred-line1. HTML 片段占比不得喧宾夺主 2. 每个可视化片段必须服务于具体的信息表达需求。 3. 绝对禁止输出 !DOCTYPE/html/head/body 全量页面框架禁止将整段回复包裹于单一 HTML 块。 4. 图形仅限流程图、架构图、状态机、树状层级、对比矩阵、数据图表。禁止装饰性插画、氛围图、风景、图标装饰。 5. 在采用html表达时请同时考虑Token效率与效果的取舍及渲染难度和错误率不要过度设计造成效果失衡。 6. 过于复杂的html可视化内容需慎重考虑。/red-line/vision-plusboundaryconstraint永远仅输出自包含片段只输出 div, style, script 等局部渲染标签绝对禁止输出 !DOCTYPE, html, head, body 等全量页面框架结构本末倒置将导致直接判错。/constraintconstraint无缝嵌入正文流HTML 片段必须像一段加粗或列表一样自然穿插在 Markdown 文本之间文字解释与可视化元素相互配合禁止整段回复全量包裹于一个巨大 HTML 块中。/constraint/boundary/html-visual/formatrequire更积极的使用html-visual为用户提供更好的回复质量和效果要求默认风格为“黑白灰为主色调用线条和留白建立层次不依赖彩色渐变。需突出和强调的内容鼓励彩色的高级克制的使用突出设计感”。/require你可以选择放在系统提示词或客户端的记忆文件里长期生效。Cherry Studio 中支持是比较完善的如果是其它客户端需要自己测试生效。至于网页端可以尝试另一个社区佬做的油猴插件应该也会持续更新greasyfork.org/zh-CN/scripts/579427-ai-raw-html-fragment-renderer怎么判断该不该用问自己一个问题这段 AI 输出是给机器继续处理还是给人马上阅读给机器的代码说明、知识库、项目文档、后续要让 AI 读取修改的→ Markdown。给人的方案汇报、学习讲解、复杂信息总结、要发给别人看的→ HTML 增强。最后说几句未来人机协作里人通过 Markdown 和 AI 进行交互AI 通过 HTML 给人类展示。这就是未来的趋势之一各个大模型厂商应该都会向这边进行倾向。但在现在如果想体验我觉得会分三步。现在Markdown 内嵌 HTML门槛低效果明显但 token 浪费、样式重复。下一步模板化组件模型输出结构化数据客户端用预置组件渲染省 token 视觉统一。最终形态AI 直接生成交互界面你问三个方案怎么选它给你的不是 3000 字而是一个对比面板、一个权重滑块、一个风险提示区点击每个因素可以展开解释——模型负责意图和数据客户端负责渲染交互。人和 AI 的交互不应该永远停留在你发一段话我回一段话。很多任务天然更适合界面选择、比较、筛选、调整、确认。文本是最通用的起点但不是终点。不过话说回来HTML 输出不是万能药。如果 AI 的判断是空的、逻辑是散的、信息是水的换成 HTML 只会变成更漂亮的废话。好的 AI 输出顺序永远是先有准确判断再有清晰结构最后才是视觉呈现。Markdown 和 HTML 的争论表面是格式之争本质是 AI 输出正在进入下一个阶段——从把话说出来变成把信息组织成可理解的界面。我是单向箔我们下次再见。