用嘴剪视频的时代来了！html-video粘个链接自动生成带动画 MP4，14 种 AI Agent 随你挑

发布时间：2026/6/8 22:15:09

用嘴剪视频的时代来了粘个链接自动生成带动画 MP414 种 AI Agent 随你挑Apache 2.0 开源还在用剪映一帧帧拖时间线还在为一条产品宣传片找外包花几千块html-video 来了——把文章链接或 GitHub 仓库丢进去AI Agent 自动拆分内容、编排多帧故事板、渲染带动画的 HTML 视频最后输出真实 MP4。14 种 Coding Agent 随便选21 套精选模板开箱即用全在本机运行零渲染费目录1. html-video 是什么2. 先看效果3. 为什么需要 html-video4. 核心能力速览5. 一句话讲清工作流程6. 三种输入一条管线7. 14 种 Coding Agent 支持8. 21 套精选模板9. 快速上手3 条命令跑起来10. AI 配乐音乐旁白11. 架构设计与可插拔引擎12. 优缺点与适用场景13. 总结1. html-video 是什么html-video是 Open Design 团队开源的AI Agent 驱动视频生成工具核心理念HTML becomes video — on your laptop.你只需要描述一个视频或粘一个链接 / GitHub 仓库AI Agent 自动编排内容选择模板生成多帧动画 HTML本地无头 Chromium 逐帧录制 → ffmpeg 编码 → 输出真实 MP4关键数据项目地址https://github.com/nexu-io/html-video 许可证Apache 2.0无渲染费、无席位上限、无贡献者协议支持 Agent14 种Coding Agent 模板数量21 套精选模板渲染方式本机无头 Chromium ffmpeg零云端依赖2. 先看效果下面每个模板都是真实渲染的带动画 HTML 视频不是效果图模板分类效果frame-data-chart-nyt数据可视化纽约时报风格动态折线图 — 大标题、标注数据点、来源行。适合「数字涨上去了」类叙事frame-glitch-title标题卡⚡ 带色彩偏移与扫描线的故障标题。适合开场、爆点、「系统上线」式能量感frame-liquid-bg-hero主视觉极光液态渐变背景居中大标题。适合产品发布与有力口号frame-light-leak-cinema电影感暖色胶片颗粒漏光的电影感画面。适合氛围片、品牌片vfx-text-cursor特效⌨️ 打字机文字闪烁终端光标。适合代码风揭示、CLI 演示frame-logo-outro片尾️ 干净 Logo 动画结束卡。适合任何视频结尾的品牌落版还有 15 个模板覆盖多场景产品宣传、动感排版、瑞士网格数据卡、决策树解说、有机动效、暖色颗粒杂志风等。3. 为什么需要 html-videoHTML→Video 是个真实存在的品类但现有方案各有各的主张引擎范式痛点HyperframesHTML CSS GSAP只有单一渲染范式RemotionReact 组件source-available4 人以上收费Motion Canvas / RevideoTypeScript 生成器最适合解说类但不够通用Manim数学 / 3D 优先太小众问题每个引擎都要学它自己的创作模型按场景挑引擎、学每种模型、再拼成一条工作流耗的是真实工程时间。多数团队挑一个然后忍受局限。html-video 的解法做一个凌驾于所有引擎之上的 meta-layer。┌──────────────────────────────────────────────┐ │ 你用户 │ │ 描述视频 / 粘链接 / 粘仓库 │ └───────────────────┬──────────────────────────┘ ▼ ┌──────────────────────────────────────────────┐ │ AI Agent Meta-Layer │ │ agent 挑引擎挑模板填内容编排故事板 │ │ 引擎只是一个 render() 接口的实现细节 │ └───────────────────┬──────────────────────────┘ ▼ ┌──────────────────────────────────────────────┐ │ 可插拔渲染引擎 │ │ ✅ Hyperframes | ️ Remotion │ │ ️ Motion Canvas | ️ Manim │ │ 加一个新引擎 → 所有模板所有 Agent 自动可用 │ └──────────────────────────────────────────────┘核心契约一个render(input, ctx)接口任何后端满足它即可接入。换引擎不用重写不用学新 DSL。4. 核心能力速览#能力一句话说明14 种 AgentClaude Code / Cursor / Gemini / Windsurf / Codex / Copilot 等PATH 自动探测顶栏一键切换真实 MP4无头 Chromium 逐帧录制 → ffmpeg 编码全本地零云端渲染费链接→视频粘 URL 或 GitHub 仓库studio 服务端抓取支持微信公众号自动生成21 套模板精选许可清晰覆盖数据可视化 / 产品宣传 / 社媒短片 / 解说 / 特效多帧故事板content-graph 驱动逐帧改文案、重排、重渲染AI 配乐MiniMax 生成背景音乐旁白 TTS导出时混入 MP4Studio CLI浏览器可视化 Studio 可脚本化 CLI两种使用方式Apache 2.0无渲染费、无席位上限、无贡献者协议5. 一句话讲清工作流程从输入到输出6 步全自动prompt / 链接 / 仓库 │ ▼ ① 来源抓取 studio 服务端拉取 URL 或仓库扁平成 Markdown │ ▼ ② Agent 循环 Agent 读素材所选模板风格 → │ 产出 content-graph故事板每帧一个 HTML 块 ▼ ③ content-graph 多帧中间表示节点实体/数据/文本边顺序/依赖/对比 │ 拓扑排序成帧序与时长 ▼ ④ 逐帧 HTML 每个节点变成自包含、带动画的 HTML 帧落到磁盘 │ ▼ ⑤ Hyperframes 渲染无头 Chromium 加载每帧、录制自动延长以覆盖动画→ webm │ ▼ ⑥ ffmpeg webm → mp4libx264concat 成一支视频 │ 可选混入 MiniMax 音乐旁白 ▼ 你的.mp4关键设计②–④ 是 meta-layer 的核心Agent 决定故事板引擎决定怎么画互不渗透⑤ 是引擎相关以后换成 Remotion 或 Motion Canvas只替换这一环其余原封不动单帧视频走快速路径一个模板、一个 HTML直接渲染6. 三种输入一条管线输入一网页文章你做一个解读视频 https://mp.weixin.qq.com/s/… Agent好我读完了《用嘴剪视频的时代来了…》这篇文章 → 基于真实要点生成多帧解说视频服务端抓取并扁平成 Markdown微信公众号文章开箱即用无需登录的服务端渲染页面直接支持输入二GitHub 仓库你帮我做个介绍视频 https://github.com/xxx/yyy Agent我拉取了仓库的 README 和结构 → 生成「这个项目到底是什么」的结构化讲解视频通过公开 API 拉取简介、顶层结构、README✍️ 输入三一句话描述你做一个关于 AI 发展史的 30 秒短视频 Agent好的我来编排内容 → 从零写内容、选模板、生成视频无论哪种输入内容都成为视频真正依据的素材不是套模板时的摆设。Agent 读取内容后决定需要几个场景写出 content-graph 故事板要点→帧关系→边把模板视觉风格逐帧应用一篇 1500 字文章 → 有节奏的多场景解说每句可追溯回原文7. 14 种 Coding Agent 支持html-video 支持14 种 Coding Agent全部在PATH上自动探测Studio 顶栏一键切换Agent探测方式调用方式Open Design (Vela)vela/ 应用内置ACP over stdio一次登录任选模型Windsurf CLIwindsurfwindsurf --yoloTrae CLItraeclitraecli acp serve --yoloClaude Codeclaudeclaude --printstdinCursor Agentcursor-agentcursor-agent --printCodex CLIcodexcodex execstdinGemini CLIgeministdinGrok Buildgrokgrok -p promptQwen CodeqwenstdinOpenCodeopencodeopencode runstdinCopilot CLIcopilotcopilot --allow-all-toolsAideraideraider --message promptHermeshermesACP CLIAnthropic APIBYOK直连 Messages API 什么都没装配一个 Anthropic API KeyStudio 直接走 Messages API无需安装任何 CLI8. 21 套精选模板模板不是随机凑的。每个模板都是一个自包含、Agent 可读的单元由template.html-video.yaml清单描述模板分类分类数量代表模板数据可视化多个NYT 风格折线图、Swiss/Vignelli 网格数据卡⚡ 标题与特效多个故障标题、动感排版、打字机光标主视觉与电影感多个液态渐变、漏光、暖色颗粒产品宣传多个15 秒 / 30 秒多场景宣传片解说骨架多个决策树解说️ 片尾多个Logo 动画结束卡模板的四大元数据它用来做什么—category、tags、best_for如「企业幻灯片」「极简报告卡」search-templates匹配你的意图它输出什么— 分辨率、画幅比、fps、时长上下限、alpha 通道、音频要喂什么进去—inputsJSON SchemaAgent 精确知道要填哪些文本/数据槽位许可来源— SPDX 标识 attribution_required/redistribution_allowed/commercial_use标志许可清晰商业无忧每个模板从构造上就许可清晰fork 来的保留原始许可NOTICE.md记下每个来源与 SPDX没有清晰宽松许可的一律不收任何一个模板都可以放进商业作品无需再做审查9. 快速上手3 条命令跑起来前置依赖依赖最低版本检查命令Node.js20node --versionpnpm9pnpm --versionffmpeg任意较新ffmpeg -versionChromium—npx playwright install chromium安装启动# 1. 克隆仓库gitclone https://github.com/nexu-io/html-videocdhtml-video# 2. 安装依赖构建pnpminstallpnpm-rbuild# 3. 启动 Studionodepackages/cli/dist/bin.js studio# 浏览器打开 http://127.0.0.1:3071CLI 工具# 探测已安装的 Agent 引擎nodepackages/cli/dist/bin.js doctor# 按意图搜索模板nodepackages/cli/dist/bin.js search-templates--intentgithub stars race--top3Studio 使用流程挑模板或直接描述视频 / 粘链接跟 Agent 对话它自动编排内容逐帧改文案调整帧序加配乐可选导出 MP410. AI 配乐音乐旁白在Settings → Audio填入 MiniMax API Key然后在每个项目的Soundtrack面板功能操作效果背景音乐描述一种情绪如舒缓的电影感氛围缓慢推进MiniMax 生成器乐️ 旁白输入文案MiniMax TTS 朗读混音自动音乐压低到人声之下可选淡入淡出输出ffmpeg 混入 MP4一条完整带声视频没配 KeyStudio 其余部分照常工作只是没有配乐功能。11. 架构设计与可插拔引擎代码结构packages/ ├── core/ 核心类型、registry、orchestrator │ MiniMax provider ffmpeg 音轨混合 ├── content-graph/ 多帧故事板中间表示节点边拓扑排序 │ runtime/ Agent 运行时探测 / spawn / 流式 ├── adapter-hyperframes/ Hyperframes 引擎适配器Chromium ffmpeg ├── cli/ html-video 命令 Studio HTTP server 来源抓取 └── project-studio/ 浏览器 Studio UI templates/ 21 个精选模板 research/ RFC 文档引擎适配器 / 模板元数据 / content-graph可插拔引擎架构┌─────────────────────────────────────────────┐ │ 统一适配器接口 │ │ render(input, ctx) │ ├─────────────┬───────────────┬───────────────┤ │ ✅ Hyper- │ ️ Remotion │ ️ Motion │ │ frames │ │ Canvas │ │ (已发布) │ (计划中) │ (计划中) │ ├─────────────┼───────────────┼───────────────┤ │ HTMLCSS │ React 组件 │ TS 生成器 │ │ GSAP │ │ │ │ → Chromium │ → React 渲染 │ → Canvas │ │ → ffmpeg │ → ffmpeg │ → ffmpeg │ └─────────────┴───────────────┴───────────────┘ ️ Manim (调研中) — 数学/3D 优先加一个新引擎实现render(input, ctx)接口 → 所有模板、所有 Agent、整条 Studio 工作流自动可用。路线图状态里程碑✅ 已完成引擎适配器规范、模板元数据格式、多帧故事板工作流✅ 已完成Studio 实时模板库 Agent 切换器逐帧编辑✅ 已完成来源素材文章/仓库→视频、AI 配乐、真实 MP4 渲染✅ 已完成Agent 模型选择Open Design Vela 后端️ 计划中Remotion / Motion Canvas / Revideo 适配器️ 计划中Agent skill 包模板市场12. 优缺点与适用场景✅ 适合的场景场景说明公众号/博客解读视频粘链接一键生成内容自动拆分开源项目介绍视频GitHub 仓库 → 结构化讲解视频数据可视化动画NYT 风格图表适合「数字涨了」叙事社媒短视频15s/30s 多场景产品宣传品牌片/氛围片电影感模板 AI 配乐⚖️ 优缺点分析维度评分说明创新性⭐⭐⭐⭐⭐Agent Meta-Layer 思路新颖引擎可插拔易用性⭐⭐⭐⭐3 条命令启动粘链接即用Agent 生态⭐⭐⭐⭐⭐14 种 Agent 全覆盖自动探测模板质量⭐⭐⭐⭐21 套精选许可清晰商业无忧配乐能力⭐⭐⭐⭐MiniMax 音乐旁白混音自动开源友好⭐⭐⭐⭐⭐Apache 2.0无渲染费无席位上限引擎成熟度⭐⭐⭐目前仅 Hyperframes 可用其余在计划中渲染性能⭐⭐⭐依赖本机 Chromium渲染速度受硬件限制⚠️ 注意事项目前仅 Hyperframes 引擎可用Remotion / Motion Canvas / Manim 尚未适配渲染依赖本机 Chromium ffmpeg需要一定硬件配置AI 配乐需要 MiniMax API Key复杂长视频的渲染时间可能较长13. 总结html-video 是“用嘴剪视频”理念的真正践行者️一句话/一个链接 → 视频Agent 自动编排无需手动拖时间线14 种 Agent 随你挑Claude / Cursor / Gemini / Windsurf 全覆盖21 套精选模板数据可视化、产品宣传、电影感、特效商业无忧AI 配乐音乐旁白一键混入可插拔引擎Hyperframes 已发布Remotion/Motion Canvas/Manim 在路上Apache 2.0零渲染费、零绑定、完全开源推荐指数⭐⭐⭐⭐引擎生态待完善但架构前瞻性极强如果你经常需要把文章、仓库或想法快速变成视频html-video 是目前最值得关注的开源方案。核心思路——Agent Meta-Layer 凌驾于渲染引擎之上——很可能成为视频生成工具的下一代范式。项目地址https://github.com/nexu-io/html-video标签#html-video #AI视频生成 #Agent #Chromium #ffmpeg #AIGC #自动化

AI应用初识

一、概述一个AI应用自底向上可以大致分为四层： LLM：大语言模型，纯粹的模型能力。算法团队负责Main Loop(react)：AI基建，让模型具备基本的交互能力（reason-act）。研发团队负责Agent：…

2026/6/8 22:15:09 阅读更多

荣耀出征官方下载：五大职业深度测评！选对职业少走弯路

作为深耕网游手游十余年的90后资深游戏宅，试过无数换皮魔幻手游，对职业同质化、版本碾压、养成断层的烂套路早已审美疲劳。近期深耕《荣耀出征》，最直观的感受就是它的职业设计跳出了行业通病，五大职业分工明确、无版本碾压、成长…

2026/6/8 22:14:06 阅读更多

Python一键式AI视觉处理包：抠图换背景、老照修复、人像转漫画、视频变卡通、中文提示出图

本文还有配套的精品资源，点击获取简介：一套开箱即用的Python图像与视频AI处理工具集，所有功能均封装为独立可执行脚本。拖入图片即可完成智能抠图（支持通用物体和人像双模式），自动分离主体并替换指定背…

2026/6/8 22:12:45 阅读更多

IINA播放器：macOS上最强大的开源视频播放解决方案

IINA播放器：macOS上最强大的开源视频播放解决方案【免费下载链接】iina The modern video player for macOS. 项目地址: https://gitcode.com/gh_mirrors/iin/iina IINA是专为macOS设计的现代化视频播放器，基于强大的mpv引擎构建，提供…

2026/6/8 23:20:24 阅读更多

别再手动转格式了！Weka 3.8保姆级教程：CSV、Excel、TXT文件一键导入与ARFF编辑实战

Weka数据导入实战：告别格式转换烦恼的一站式解决方案每次打开Weka准备大展身手时，是不是总被各种数据格式问题绊住脚步？Excel表格无法直接导入、CSV文件出现乱码、TXT文本结构混乱...这些问题不仅浪费时间，更消磨数据分析的热情。…

2026/6/8 23:20:04 阅读更多

imageio：一个 Python 库搞定所有图像视频读写

文章目录imageio：一个 Python 库搞定所有图像视频读写五个函数搞定大部分场景两个核心依赖，可选插件按需加载插件机制：一个入口，多个后端支持多种数据源典型应用场景imageio：一个 Python 库搞定所有图像视频读写 imag…

2026/6/8 23:19:03 阅读更多

2026.06.06 最新企业建站网站

随着数字化转型的持续深入，企业网站建设（建站）已经成为企业展示形象、获取客户、建立品牌公信力的核心基础设施。无论是跨国集团还是初创团队，拥有一个高性能、SEO 友好且设计精美的官方网站，都是开展互联网业务的第一…

2026/6/8 23:17:02 阅读更多

Python 实战：用 wxPython 写一个 MD5 文件查重清理工具

摘要电脑用久之后，经常会出现大量重复文件：下载过多次的安装包、重复导出的照片、备份目录里的 Office 文档、压缩包副本等。手动查找既费时间，也容易误删。本文记录一个完整的 Python 桌面工具项目：使用 wxPython 编写界面&…

2026/6/8 23:16:41 阅读更多

【计算机毕业设计案例】基于springboot+微信小程序的旅游线路定制微信小程序(程序+文档+讲解+定制)

博主介绍：✌️码农一枚 ，专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围：&am…

2026/6/8 23:14:38 阅读更多

解决老旧机顶盒资源化难题：Amlogic S9xxx Armbian项目在TY1608设备上的系统适配实现

解决老旧机顶盒资源化难题：Amlogic S9xxx Armbian项目在TY1608设备上的系统适配实现【免费下载链接】amlogic-s9xxx-armbian Supports running Armbian on Amlogic, Allwinner, and Rockchip devices. Support a311d, s922x, s905x3, s905x2, s912, s905d, s905x, …

2026/6/8 0:00:25 阅读更多

Python Scrapy 爬虫实战进阶系列（一）：轻量化数据存储 - 数据精准写入 SQLite 数据库

前言在 Python 爬虫开发领域中，Scrapy 作为高性能、高可扩展性的异步爬虫框架，是行业内采集结构化数据的首选工具。在中小型爬虫项目、本地数据采集、轻量化数据存储场景中，SQLite 无需独立服务、单文件存储、原生兼容 Python 的特性&#…

2026/6/8 0:00:45 阅读更多

3步实现Windows直读Btrfs分区：跨平台文件系统互通终极方案

3步实现Windows直读Btrfs分区：跨平台文件系统互通终极方案【免费下载链接】btrfs WinBtrfs - an open-source btrfs driver for Windows 项目地址: https://gitcode.com/gh_mirrors/bt/btrfs 还在为Windows无法访问Linux Btrfs分区而烦恼吗？你是…

2026/6/8 0:03:08 阅读更多

LED驱动技术全解析：从核心架构到实战选型与避坑指南

1. 从一颗灯珠到千亿市场：LED驱动的技术演进与商业逻辑十几年前，当我第一次从料盘上拿起一颗0603封装的白色LED时，它微弱的光晕和高达几块钱的单颗成本，让我很难想象今天它几乎照亮了我们生活的每一个角落。从手机屏幕的一抹背光&…

2026/6/8 0:06:11 阅读更多

索引堆及其优化

索引堆及其优化引言索引堆是一种数据结构，广泛应用于计算机科学和软件工程领域。它主要用于解决优先队列问题，如最小堆和最大堆。本文将详细介绍索引堆的概念、实现方法以及优化策略。索引堆的定义索引堆是一种基于堆数据结构的索引机制。它通过维护一个堆来存储数据…

2026/6/8 0:06:11 阅读更多

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

更多请点击： https://intelliparadigm.com 第一章：CSDN AI 数字营销的官方引流卡片是什么功能？ CSDN AI 数字营销平台推出的「官方引流卡片」，是一种面向技术创作者的轻量级、可嵌入式内容分发组件，专为提升博文、教程…

2026/6/8 0:06:11 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/8 9:43:25 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/8 9:43:23 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/8 9:43:30 阅读更多

相关文章

AI应用初识

荣耀出征官方下载：五大职业深度测评！选对职业少走弯路

Python一键式AI视觉处理包：抠图换背景、老照修复、人像转漫画、视频变卡通、中文提示出图

IINA播放器：macOS上最强大的开源视频播放解决方案

别再手动转格式了！Weka 3.8保姆级教程：CSV、Excel、TXT文件一键导入与ARFF编辑实战

imageio：一个 Python 库搞定所有图像视频读写

2026.06.06 最新企业建站网站

Python 实战：用 wxPython 写一个 MD5 文件查重清理工具

【计算机毕业设计案例】基于springboot+微信小程序的旅游线路定制微信小程序(程序+文档+讲解+定制)

解决老旧机顶盒资源化难题：Amlogic S9xxx Armbian项目在TY1608设备上的系统适配实现

Python Scrapy 爬虫实战进阶系列（一）：轻量化数据存储 - 数据精准写入 SQLite 数据库

3步实现Windows直读Btrfs分区：跨平台文件系统互通终极方案

LED驱动技术全解析：从核心架构到实战选型与避坑指南

索引堆及其优化

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因