用嘴剪视频的时代来了粘个链接自动生成带动画 MP414 种 AI Agent 随你挑Apache 2.0 开源 还在用剪映一帧帧拖时间线还在为一条产品宣传片找外包花几千块html-video 来了——把文章链接或 GitHub 仓库丢进去AI Agent 自动拆分内容、编排多帧故事板、渲染带动画的 HTML 视频最后输出真实 MP4。14 种 Coding Agent 随便选21 套精选模板开箱即用全在本机运行零渲染费 目录1. html-video 是什么2. 先看效果3. 为什么需要 html-video4. 核心能力速览5. 一句话讲清工作流程6. 三种输入一条管线7. 14 种 Coding Agent 支持8. 21 套精选模板9. 快速上手3 条命令跑起来10. AI 配乐音乐 旁白11. 架构设计与可插拔引擎12. 优缺点与适用场景13. 总结1. html-video 是什么html-video是 Open Design 团队开源的AI Agent 驱动视频生成工具核心理念HTML becomes video — on your laptop.你只需要描述一个视频或粘一个链接 / GitHub 仓库AI Agent 自动编排内容 选择模板 生成多帧动画 HTML本地无头 Chromium 逐帧录制 → ffmpeg 编码 → 输出真实 MP4关键数据 项目地址https://github.com/nexu-io/html-video 许可证Apache 2.0无渲染费、无席位上限、无贡献者协议 支持 Agent14 种Coding Agent 模板数量21 套精选模板 渲染方式本机无头 Chromium ffmpeg零云端依赖2. 先看效果下面每个模板都是真实渲染的带动画 HTML 视频不是效果图模板分类效果frame-data-chart-nyt数据可视化 纽约时报风格动态折线图 — 大标题、标注数据点、来源行。适合「数字涨上去了」类叙事frame-glitch-title标题卡⚡ 带色彩偏移与扫描线的故障标题。适合开场、爆点、「系统上线」式能量感frame-liquid-bg-hero主视觉 极光液态渐变背景 居中大标题。适合产品发布与有力口号frame-light-leak-cinema电影感 暖色胶片颗粒 漏光的电影感画面。适合氛围片、品牌片vfx-text-cursor特效⌨️ 打字机文字 闪烁终端光标。适合代码风揭示、CLI 演示frame-logo-outro片尾️ 干净 Logo 动画结束卡。适合任何视频结尾的品牌落版还有 15 个模板覆盖多场景产品宣传、动感排版、瑞士网格数据卡、决策树解说、有机动效、暖色颗粒杂志风等。3. 为什么需要 html-videoHTML→Video 是个真实存在的品类但现有方案各有各的主张引擎范式痛点HyperframesHTML CSS GSAP只有单一渲染范式RemotionReact 组件source-available4 人以上收费Motion Canvas / RevideoTypeScript 生成器最适合解说类但不够通用Manim数学 / 3D 优先太小众问题每个引擎都要学它自己的创作模型按场景挑引擎、学每种模型、再拼成一条工作流耗的是真实工程时间。多数团队挑一个然后忍受局限。html-video 的解法做一个凌驾于所有引擎之上的 meta-layer。┌──────────────────────────────────────────────┐ │ 你用户 │ │ 描述视频 / 粘链接 / 粘仓库 │ └───────────────────┬──────────────────────────┘ ▼ ┌──────────────────────────────────────────────┐ │ AI Agent Meta-Layer │ │ agent 挑引擎 挑模板 填内容 编排故事板 │ │ 引擎只是一个 render() 接口的实现细节 │ └───────────────────┬──────────────────────────┘ ▼ ┌──────────────────────────────────────────────┐ │ 可插拔渲染引擎 │ │ ✅ Hyperframes | ️ Remotion │ │ ️ Motion Canvas | ️ Manim │ │ 加一个新引擎 → 所有模板 所有 Agent 自动可用 │ └──────────────────────────────────────────────┘核心契约一个render(input, ctx)接口任何后端满足它即可接入。换引擎不用重写不用学新 DSL。4. 核心能力速览#能力一句话说明14 种 AgentClaude Code / Cursor / Gemini / Windsurf / Codex / Copilot 等PATH 自动探测顶栏一键切换真实 MP4无头 Chromium 逐帧录制 → ffmpeg 编码全本地零云端渲染费链接→视频粘 URL 或 GitHub 仓库studio 服务端抓取支持微信公众号自动生成21 套模板精选 许可清晰覆盖数据可视化 / 产品宣传 / 社媒短片 / 解说 / 特效多帧故事板content-graph 驱动逐帧改文案、重排、重渲染AI 配乐MiniMax 生成背景音乐 旁白 TTS导出时混入 MP4Studio CLI浏览器可视化 Studio 可脚本化 CLI两种使用方式Apache 2.0无渲染费、无席位上限、无贡献者协议5. 一句话讲清工作流程从输入到输出6 步全自动prompt / 链接 / 仓库 │ ▼ ① 来源抓取 studio 服务端拉取 URL 或仓库扁平成 Markdown │ ▼ ② Agent 循环 Agent 读素材 所选模板风格 → │ 产出 content-graph故事板 每帧一个 HTML 块 ▼ ③ content-graph 多帧中间表示节点实体/数据/文本 边顺序/依赖/对比 │ 拓扑排序成帧序与时长 ▼ ④ 逐帧 HTML 每个节点变成自包含、带动画的 HTML 帧落到磁盘 │ ▼ ⑤ Hyperframes 渲染 无头 Chromium 加载每帧、录制自动延长以覆盖动画→ webm │ ▼ ⑥ ffmpeg webm → mp4libx264concat 成一支视频 │ 可选混入 MiniMax 音乐 旁白 ▼ 你的.mp4关键设计②–④ 是 meta-layer 的核心Agent 决定故事板引擎决定怎么画互不渗透⑤ 是引擎相关以后换成 Remotion 或 Motion Canvas只替换这一环其余原封不动单帧视频走快速路径一个模板、一个 HTML直接渲染6. 三种输入一条管线 输入一网页文章你 做一个解读视频 https://mp.weixin.qq.com/s/… Agent好我读完了《用嘴剪视频的时代来了…》这篇文章 → 基于真实要点生成多帧解说视频服务端抓取并扁平成 Markdown微信公众号文章开箱即用无需登录的服务端渲染页面直接支持 输入二GitHub 仓库你 帮我做个介绍视频 https://github.com/xxx/yyy Agent我拉取了仓库的 README 和结构 → 生成「这个项目到底是什么」的结构化讲解视频通过公开 API 拉取简介、顶层结构、README✍️ 输入三一句话描述你 做一个关于 AI 发展史的 30 秒短视频 Agent好的我来编排内容 → 从零写内容、选模板、生成视频无论哪种输入内容都成为视频真正依据的素材不是套模板时的摆设。Agent 读取内容后决定需要几个场景写出 content-graph 故事板要点→帧关系→边把模板视觉风格逐帧应用一篇 1500 字文章 → 有节奏的多场景解说每句可追溯回原文7. 14 种 Coding Agent 支持html-video 支持14 种 Coding Agent全部在PATH上自动探测Studio 顶栏一键切换Agent探测方式调用方式Open Design (Vela)vela/ 应用内置ACP over stdio一次登录任选模型Windsurf CLIwindsurfwindsurf --yoloTrae CLItraeclitraecli acp serve --yoloClaude Codeclaudeclaude --printstdinCursor Agentcursor-agentcursor-agent --printCodex CLIcodexcodex execstdinGemini CLIgeministdinGrok Buildgrokgrok -p promptQwen CodeqwenstdinOpenCodeopencodeopencode runstdinCopilot CLIcopilotcopilot --allow-all-toolsAideraideraider --message promptHermeshermesACP CLIAnthropic APIBYOK直连 Messages API 什么都没装配一个 Anthropic API KeyStudio 直接走 Messages API无需安装任何 CLI8. 21 套精选模板模板不是随机凑的。每个模板都是一个自包含、Agent 可读的单元由template.html-video.yaml清单描述模板分类分类数量代表模板 数据可视化多个NYT 风格折线图、Swiss/Vignelli 网格数据卡⚡ 标题与特效多个故障标题、动感排版、打字机光标 主视觉与电影感多个液态渐变、漏光、暖色颗粒 产品宣传多个15 秒 / 30 秒多场景宣传片 解说骨架多个决策树解说️ 片尾多个Logo 动画结束卡模板的四大元数据它用来做什么—category、tags、best_for如「企业幻灯片」「极简报告卡」search-templates匹配你的意图它输出什么— 分辨率、画幅比、fps、时长上下限、alpha 通道、音频要喂什么进去—inputsJSON SchemaAgent 精确知道要填哪些文本/数据槽位许可来源— SPDX 标识 attribution_required/redistribution_allowed/commercial_use标志 许可清晰商业无忧每个模板从构造上就许可清晰fork 来的保留原始许可NOTICE.md记下每个来源与 SPDX没有清晰宽松许可的一律不收任何一个模板都可以放进商业作品无需再做审查9. 快速上手3 条命令跑起来前置依赖依赖最低版本检查命令Node.js20node --versionpnpm9pnpm --versionffmpeg任意较新ffmpeg -versionChromium—npx playwright install chromium安装 启动# 1. 克隆仓库gitclone https://github.com/nexu-io/html-videocdhtml-video# 2. 安装依赖 构建pnpminstallpnpm-rbuild# 3. 启动 Studionodepackages/cli/dist/bin.js studio# 浏览器打开 http://127.0.0.1:3071CLI 工具# 探测已安装的 Agent 引擎nodepackages/cli/dist/bin.js doctor# 按意图搜索模板nodepackages/cli/dist/bin.js search-templates--intentgithub stars race--top3Studio 使用流程挑模板或直接描述视频 / 粘链接跟 Agent 对话它自动编排内容逐帧改文案调整帧序加配乐可选导出 MP410. AI 配乐音乐 旁白在Settings → Audio填入 MiniMax API Key然后在每个项目的Soundtrack面板功能操作效果 背景音乐描述一种情绪如舒缓的电影感氛围缓慢推进MiniMax 生成器乐️ 旁白输入文案MiniMax TTS 朗读 混音自动音乐压低到人声之下可选淡入淡出 输出ffmpeg 混入 MP4一条完整带声视频 没配 KeyStudio 其余部分照常工作只是没有配乐功能。11. 架构设计与可插拔引擎代码结构packages/ ├── core/ 核心类型、registry、orchestrator │ MiniMax provider ffmpeg 音轨混合 ├── content-graph/ 多帧故事板中间表示节点边拓扑排序 │ runtime/ Agent 运行时探测 / spawn / 流式 ├── adapter-hyperframes/ Hyperframes 引擎适配器Chromium ffmpeg ├── cli/ html-video 命令 Studio HTTP server 来源抓取 └── project-studio/ 浏览器 Studio UI templates/ 21 个精选模板 research/ RFC 文档引擎适配器 / 模板元数据 / content-graph可插拔引擎架构┌─────────────────────────────────────────────┐ │ 统一适配器接口 │ │ render(input, ctx) │ ├─────────────┬───────────────┬───────────────┤ │ ✅ Hyper- │ ️ Remotion │ ️ Motion │ │ frames │ │ Canvas │ │ (已发布) │ (计划中) │ (计划中) │ ├─────────────┼───────────────┼───────────────┤ │ HTMLCSS │ React 组件 │ TS 生成器 │ │ GSAP │ │ │ │ → Chromium │ → React 渲染 │ → Canvas │ │ → ffmpeg │ → ffmpeg │ → ffmpeg │ └─────────────┴───────────────┴───────────────┘ ️ Manim (调研中) — 数学/3D 优先加一个新引擎实现render(input, ctx)接口 → 所有模板、所有 Agent、整条 Studio 工作流自动可用。路线图状态里程碑✅ 已完成引擎适配器规范、模板元数据格式、多帧故事板工作流✅ 已完成Studio 实时模板库 Agent 切换器 逐帧编辑✅ 已完成来源素材文章/仓库→视频、AI 配乐、真实 MP4 渲染✅ 已完成Agent 模型选择Open Design Vela 后端️ 计划中Remotion / Motion Canvas / Revideo 适配器️ 计划中Agent skill 包 模板市场12. 优缺点与适用场景✅ 适合的场景场景说明 公众号/博客解读视频粘链接一键生成内容自动拆分 开源项目介绍视频GitHub 仓库 → 结构化讲解视频 数据可视化动画NYT 风格图表适合「数字涨了」叙事 社媒短视频15s/30s 多场景产品宣传 品牌片/氛围片电影感模板 AI 配乐⚖️ 优缺点分析维度评分说明创新性⭐⭐⭐⭐⭐Agent Meta-Layer 思路新颖引擎可插拔易用性⭐⭐⭐⭐3 条命令启动粘链接即用Agent 生态⭐⭐⭐⭐⭐14 种 Agent 全覆盖自动探测模板质量⭐⭐⭐⭐21 套精选许可清晰商业无忧配乐能力⭐⭐⭐⭐MiniMax 音乐 旁白混音自动开源友好⭐⭐⭐⭐⭐Apache 2.0无渲染费无席位上限引擎成熟度⭐⭐⭐目前仅 Hyperframes 可用其余在计划中渲染性能⭐⭐⭐依赖本机 Chromium渲染速度受硬件限制⚠️ 注意事项目前仅 Hyperframes 引擎可用Remotion / Motion Canvas / Manim 尚未适配渲染依赖本机 Chromium ffmpeg需要一定硬件配置AI 配乐需要 MiniMax API Key复杂长视频的渲染时间可能较长13. 总结html-video 是“用嘴剪视频”理念的真正践行者️一句话/一个链接 → 视频Agent 自动编排无需手动拖时间线14 种 Agent 随你挑Claude / Cursor / Gemini / Windsurf 全覆盖21 套精选模板数据可视化、产品宣传、电影感、特效商业无忧AI 配乐音乐 旁白一键混入可插拔引擎Hyperframes 已发布Remotion/Motion Canvas/Manim 在路上Apache 2.0零渲染费、零绑定、完全开源推荐指数⭐⭐⭐⭐引擎生态待完善但架构前瞻性极强如果你经常需要把文章、仓库或想法快速变成视频html-video 是目前最值得关注的开源方案。核心思路——Agent Meta-Layer 凌驾于渲染引擎之上——很可能成为视频生成工具的下一代范式。 项目地址https://github.com/nexu-io/html-video标签#html-video #AI视频生成 #Agent #Chromium #ffmpeg #AIGC #自动化
用嘴剪视频的时代来了!html-video粘个链接自动生成带动画 MP4,14 种 AI Agent 随你挑
发布时间:2026/6/8 22:15:09
用嘴剪视频的时代来了粘个链接自动生成带动画 MP414 种 AI Agent 随你挑Apache 2.0 开源 还在用剪映一帧帧拖时间线还在为一条产品宣传片找外包花几千块html-video 来了——把文章链接或 GitHub 仓库丢进去AI Agent 自动拆分内容、编排多帧故事板、渲染带动画的 HTML 视频最后输出真实 MP4。14 种 Coding Agent 随便选21 套精选模板开箱即用全在本机运行零渲染费 目录1. html-video 是什么2. 先看效果3. 为什么需要 html-video4. 核心能力速览5. 一句话讲清工作流程6. 三种输入一条管线7. 14 种 Coding Agent 支持8. 21 套精选模板9. 快速上手3 条命令跑起来10. AI 配乐音乐 旁白11. 架构设计与可插拔引擎12. 优缺点与适用场景13. 总结1. html-video 是什么html-video是 Open Design 团队开源的AI Agent 驱动视频生成工具核心理念HTML becomes video — on your laptop.你只需要描述一个视频或粘一个链接 / GitHub 仓库AI Agent 自动编排内容 选择模板 生成多帧动画 HTML本地无头 Chromium 逐帧录制 → ffmpeg 编码 → 输出真实 MP4关键数据 项目地址https://github.com/nexu-io/html-video 许可证Apache 2.0无渲染费、无席位上限、无贡献者协议 支持 Agent14 种Coding Agent 模板数量21 套精选模板 渲染方式本机无头 Chromium ffmpeg零云端依赖2. 先看效果下面每个模板都是真实渲染的带动画 HTML 视频不是效果图模板分类效果frame-data-chart-nyt数据可视化 纽约时报风格动态折线图 — 大标题、标注数据点、来源行。适合「数字涨上去了」类叙事frame-glitch-title标题卡⚡ 带色彩偏移与扫描线的故障标题。适合开场、爆点、「系统上线」式能量感frame-liquid-bg-hero主视觉 极光液态渐变背景 居中大标题。适合产品发布与有力口号frame-light-leak-cinema电影感 暖色胶片颗粒 漏光的电影感画面。适合氛围片、品牌片vfx-text-cursor特效⌨️ 打字机文字 闪烁终端光标。适合代码风揭示、CLI 演示frame-logo-outro片尾️ 干净 Logo 动画结束卡。适合任何视频结尾的品牌落版还有 15 个模板覆盖多场景产品宣传、动感排版、瑞士网格数据卡、决策树解说、有机动效、暖色颗粒杂志风等。3. 为什么需要 html-videoHTML→Video 是个真实存在的品类但现有方案各有各的主张引擎范式痛点HyperframesHTML CSS GSAP只有单一渲染范式RemotionReact 组件source-available4 人以上收费Motion Canvas / RevideoTypeScript 生成器最适合解说类但不够通用Manim数学 / 3D 优先太小众问题每个引擎都要学它自己的创作模型按场景挑引擎、学每种模型、再拼成一条工作流耗的是真实工程时间。多数团队挑一个然后忍受局限。html-video 的解法做一个凌驾于所有引擎之上的 meta-layer。┌──────────────────────────────────────────────┐ │ 你用户 │ │ 描述视频 / 粘链接 / 粘仓库 │ └───────────────────┬──────────────────────────┘ ▼ ┌──────────────────────────────────────────────┐ │ AI Agent Meta-Layer │ │ agent 挑引擎 挑模板 填内容 编排故事板 │ │ 引擎只是一个 render() 接口的实现细节 │ └───────────────────┬──────────────────────────┘ ▼ ┌──────────────────────────────────────────────┐ │ 可插拔渲染引擎 │ │ ✅ Hyperframes | ️ Remotion │ │ ️ Motion Canvas | ️ Manim │ │ 加一个新引擎 → 所有模板 所有 Agent 自动可用 │ └──────────────────────────────────────────────┘核心契约一个render(input, ctx)接口任何后端满足它即可接入。换引擎不用重写不用学新 DSL。4. 核心能力速览#能力一句话说明14 种 AgentClaude Code / Cursor / Gemini / Windsurf / Codex / Copilot 等PATH 自动探测顶栏一键切换真实 MP4无头 Chromium 逐帧录制 → ffmpeg 编码全本地零云端渲染费链接→视频粘 URL 或 GitHub 仓库studio 服务端抓取支持微信公众号自动生成21 套模板精选 许可清晰覆盖数据可视化 / 产品宣传 / 社媒短片 / 解说 / 特效多帧故事板content-graph 驱动逐帧改文案、重排、重渲染AI 配乐MiniMax 生成背景音乐 旁白 TTS导出时混入 MP4Studio CLI浏览器可视化 Studio 可脚本化 CLI两种使用方式Apache 2.0无渲染费、无席位上限、无贡献者协议5. 一句话讲清工作流程从输入到输出6 步全自动prompt / 链接 / 仓库 │ ▼ ① 来源抓取 studio 服务端拉取 URL 或仓库扁平成 Markdown │ ▼ ② Agent 循环 Agent 读素材 所选模板风格 → │ 产出 content-graph故事板 每帧一个 HTML 块 ▼ ③ content-graph 多帧中间表示节点实体/数据/文本 边顺序/依赖/对比 │ 拓扑排序成帧序与时长 ▼ ④ 逐帧 HTML 每个节点变成自包含、带动画的 HTML 帧落到磁盘 │ ▼ ⑤ Hyperframes 渲染 无头 Chromium 加载每帧、录制自动延长以覆盖动画→ webm │ ▼ ⑥ ffmpeg webm → mp4libx264concat 成一支视频 │ 可选混入 MiniMax 音乐 旁白 ▼ 你的.mp4关键设计②–④ 是 meta-layer 的核心Agent 决定故事板引擎决定怎么画互不渗透⑤ 是引擎相关以后换成 Remotion 或 Motion Canvas只替换这一环其余原封不动单帧视频走快速路径一个模板、一个 HTML直接渲染6. 三种输入一条管线 输入一网页文章你 做一个解读视频 https://mp.weixin.qq.com/s/… Agent好我读完了《用嘴剪视频的时代来了…》这篇文章 → 基于真实要点生成多帧解说视频服务端抓取并扁平成 Markdown微信公众号文章开箱即用无需登录的服务端渲染页面直接支持 输入二GitHub 仓库你 帮我做个介绍视频 https://github.com/xxx/yyy Agent我拉取了仓库的 README 和结构 → 生成「这个项目到底是什么」的结构化讲解视频通过公开 API 拉取简介、顶层结构、README✍️ 输入三一句话描述你 做一个关于 AI 发展史的 30 秒短视频 Agent好的我来编排内容 → 从零写内容、选模板、生成视频无论哪种输入内容都成为视频真正依据的素材不是套模板时的摆设。Agent 读取内容后决定需要几个场景写出 content-graph 故事板要点→帧关系→边把模板视觉风格逐帧应用一篇 1500 字文章 → 有节奏的多场景解说每句可追溯回原文7. 14 种 Coding Agent 支持html-video 支持14 种 Coding Agent全部在PATH上自动探测Studio 顶栏一键切换Agent探测方式调用方式Open Design (Vela)vela/ 应用内置ACP over stdio一次登录任选模型Windsurf CLIwindsurfwindsurf --yoloTrae CLItraeclitraecli acp serve --yoloClaude Codeclaudeclaude --printstdinCursor Agentcursor-agentcursor-agent --printCodex CLIcodexcodex execstdinGemini CLIgeministdinGrok Buildgrokgrok -p promptQwen CodeqwenstdinOpenCodeopencodeopencode runstdinCopilot CLIcopilotcopilot --allow-all-toolsAideraideraider --message promptHermeshermesACP CLIAnthropic APIBYOK直连 Messages API 什么都没装配一个 Anthropic API KeyStudio 直接走 Messages API无需安装任何 CLI8. 21 套精选模板模板不是随机凑的。每个模板都是一个自包含、Agent 可读的单元由template.html-video.yaml清单描述模板分类分类数量代表模板 数据可视化多个NYT 风格折线图、Swiss/Vignelli 网格数据卡⚡ 标题与特效多个故障标题、动感排版、打字机光标 主视觉与电影感多个液态渐变、漏光、暖色颗粒 产品宣传多个15 秒 / 30 秒多场景宣传片 解说骨架多个决策树解说️ 片尾多个Logo 动画结束卡模板的四大元数据它用来做什么—category、tags、best_for如「企业幻灯片」「极简报告卡」search-templates匹配你的意图它输出什么— 分辨率、画幅比、fps、时长上下限、alpha 通道、音频要喂什么进去—inputsJSON SchemaAgent 精确知道要填哪些文本/数据槽位许可来源— SPDX 标识 attribution_required/redistribution_allowed/commercial_use标志 许可清晰商业无忧每个模板从构造上就许可清晰fork 来的保留原始许可NOTICE.md记下每个来源与 SPDX没有清晰宽松许可的一律不收任何一个模板都可以放进商业作品无需再做审查9. 快速上手3 条命令跑起来前置依赖依赖最低版本检查命令Node.js20node --versionpnpm9pnpm --versionffmpeg任意较新ffmpeg -versionChromium—npx playwright install chromium安装 启动# 1. 克隆仓库gitclone https://github.com/nexu-io/html-videocdhtml-video# 2. 安装依赖 构建pnpminstallpnpm-rbuild# 3. 启动 Studionodepackages/cli/dist/bin.js studio# 浏览器打开 http://127.0.0.1:3071CLI 工具# 探测已安装的 Agent 引擎nodepackages/cli/dist/bin.js doctor# 按意图搜索模板nodepackages/cli/dist/bin.js search-templates--intentgithub stars race--top3Studio 使用流程挑模板或直接描述视频 / 粘链接跟 Agent 对话它自动编排内容逐帧改文案调整帧序加配乐可选导出 MP410. AI 配乐音乐 旁白在Settings → Audio填入 MiniMax API Key然后在每个项目的Soundtrack面板功能操作效果 背景音乐描述一种情绪如舒缓的电影感氛围缓慢推进MiniMax 生成器乐️ 旁白输入文案MiniMax TTS 朗读 混音自动音乐压低到人声之下可选淡入淡出 输出ffmpeg 混入 MP4一条完整带声视频 没配 KeyStudio 其余部分照常工作只是没有配乐功能。11. 架构设计与可插拔引擎代码结构packages/ ├── core/ 核心类型、registry、orchestrator │ MiniMax provider ffmpeg 音轨混合 ├── content-graph/ 多帧故事板中间表示节点边拓扑排序 │ runtime/ Agent 运行时探测 / spawn / 流式 ├── adapter-hyperframes/ Hyperframes 引擎适配器Chromium ffmpeg ├── cli/ html-video 命令 Studio HTTP server 来源抓取 └── project-studio/ 浏览器 Studio UI templates/ 21 个精选模板 research/ RFC 文档引擎适配器 / 模板元数据 / content-graph可插拔引擎架构┌─────────────────────────────────────────────┐ │ 统一适配器接口 │ │ render(input, ctx) │ ├─────────────┬───────────────┬───────────────┤ │ ✅ Hyper- │ ️ Remotion │ ️ Motion │ │ frames │ │ Canvas │ │ (已发布) │ (计划中) │ (计划中) │ ├─────────────┼───────────────┼───────────────┤ │ HTMLCSS │ React 组件 │ TS 生成器 │ │ GSAP │ │ │ │ → Chromium │ → React 渲染 │ → Canvas │ │ → ffmpeg │ → ffmpeg │ → ffmpeg │ └─────────────┴───────────────┴───────────────┘ ️ Manim (调研中) — 数学/3D 优先加一个新引擎实现render(input, ctx)接口 → 所有模板、所有 Agent、整条 Studio 工作流自动可用。路线图状态里程碑✅ 已完成引擎适配器规范、模板元数据格式、多帧故事板工作流✅ 已完成Studio 实时模板库 Agent 切换器 逐帧编辑✅ 已完成来源素材文章/仓库→视频、AI 配乐、真实 MP4 渲染✅ 已完成Agent 模型选择Open Design Vela 后端️ 计划中Remotion / Motion Canvas / Revideo 适配器️ 计划中Agent skill 包 模板市场12. 优缺点与适用场景✅ 适合的场景场景说明 公众号/博客解读视频粘链接一键生成内容自动拆分 开源项目介绍视频GitHub 仓库 → 结构化讲解视频 数据可视化动画NYT 风格图表适合「数字涨了」叙事 社媒短视频15s/30s 多场景产品宣传 品牌片/氛围片电影感模板 AI 配乐⚖️ 优缺点分析维度评分说明创新性⭐⭐⭐⭐⭐Agent Meta-Layer 思路新颖引擎可插拔易用性⭐⭐⭐⭐3 条命令启动粘链接即用Agent 生态⭐⭐⭐⭐⭐14 种 Agent 全覆盖自动探测模板质量⭐⭐⭐⭐21 套精选许可清晰商业无忧配乐能力⭐⭐⭐⭐MiniMax 音乐 旁白混音自动开源友好⭐⭐⭐⭐⭐Apache 2.0无渲染费无席位上限引擎成熟度⭐⭐⭐目前仅 Hyperframes 可用其余在计划中渲染性能⭐⭐⭐依赖本机 Chromium渲染速度受硬件限制⚠️ 注意事项目前仅 Hyperframes 引擎可用Remotion / Motion Canvas / Manim 尚未适配渲染依赖本机 Chromium ffmpeg需要一定硬件配置AI 配乐需要 MiniMax API Key复杂长视频的渲染时间可能较长13. 总结html-video 是“用嘴剪视频”理念的真正践行者️一句话/一个链接 → 视频Agent 自动编排无需手动拖时间线14 种 Agent 随你挑Claude / Cursor / Gemini / Windsurf 全覆盖21 套精选模板数据可视化、产品宣传、电影感、特效商业无忧AI 配乐音乐 旁白一键混入可插拔引擎Hyperframes 已发布Remotion/Motion Canvas/Manim 在路上Apache 2.0零渲染费、零绑定、完全开源推荐指数⭐⭐⭐⭐引擎生态待完善但架构前瞻性极强如果你经常需要把文章、仓库或想法快速变成视频html-video 是目前最值得关注的开源方案。核心思路——Agent Meta-Layer 凌驾于渲染引擎之上——很可能成为视频生成工具的下一代范式。 项目地址https://github.com/nexu-io/html-video标签#html-video #AI视频生成 #Agent #Chromium #ffmpeg #AIGC #自动化