第十篇：SpringAI 实战 10｜全模型流式输出（Streaming）实战：实现打字机效果

发布时间：2026/6/13 2:01:07

导读在上一章中我们成功构建了多模型共存的底层架构。但在实际体验中如果调用大模型生成一篇长文传统的同步请求需要等待几十秒模型完全生成完毕后才能一次性返回结果。这种“干等”的体验在 AI 应用中是灾难性的。真正的 AI 应用如 ChatGPT都是“边思考边输出”即流式响应Streaming Response。本章我们将基于上一章的多模型架构引入 Spring WebFlux 的响应式编程利用 SSEServer-Sent Events协议用极少的代码为 OpenAI、通义千问、DeepSeek 和 Ollama 实现丝滑的“打字机效果”。一、环境前置说明运行前提电脑安装 Ollama客户端提前拉取开源模型文件JDK21Gradle8.8SpringBoot3.5.14SpringAI1.1.7IDEA2023 社区版本章代码是在上一篇的基础上新增/修改的二、核心原理SSE 与 Flux 数据流要实现流式输出我们需要理解两个核心技术点SSEServer-Sent Events协议这是一种基于 HTTP 的单向通信协议。服务端可以主动向客户端推送数据非常适合大模型这种“服务端持续生成客户端持续渲染”的场景。Reactor 的 Flux 类型Spring WebFlux 提供了 Flux 响应式流类型。Spring AI 的 ChatClient 原生支持响应式编程只需将同步的 .call() 替换为 .stream()底层就会自动将大模型生成的增量 Token 封装为 SSE 数据流推送给前端。三、后端改造一行代码开启流式输出得益于 Spring AI 的高度抽象我们无需修改上一章的 MultiModelConfig 配置类只需在 Controller 层新增流式接口即可。引入 WebFlux 依赖确保你的 build.gradle 中包含 WebFlux 依赖Spring AI 的流式响应依赖它implementationorg.springframework.boot:spring-boot-starter-webflux新增流式 Controller我们在上一章的 MultiModelController 中新增一个流式接口。注意 produces 必须设置为 text/event-stream/** * 全模型流式输出接口 */GetMapping(value/stream/{provider},producesMediaType.TEXT_EVENT_STREAM_VALUE)publicFluxStringstreamChat(PathVariableStringprovider,RequestParam(defaultValue你好请介绍一下你自己)Stringmsg){ChatClientchatclientgetClientByProvider(provider);// 核心使用 .stream() 替代 .call()并调用 .content() 仅返回文本内容returnchatclient.prompt().user(msg).stream().content();}/** * 根据路径参数获取对应的 Client */privateChatClientgetClientByProvider(Stringprovider){returnswitch(provider.toLowerCase()){caseopenai-openaiClient;caseollama-ollamaClient;caseqwen-qwenClient;casedeepseek-deepseekClient;default-thrownewIllegalArgumentException(Unsupported provider: provider);};}代码解析Spring WebFlux 检测到返回值是 Flux 且 produces text/event-stream 时会自动启用 ServerSentEventHttpMessageWriter。每当大模型生成一个词Spring 就会自动将其包装成 data: 词语\n\n 的 SSE 格式推送到前端四、前端实战极简 HTML 实现打字机在 resources/static 目录下新建 stream-test.html文件代码如下!DOCTYPEhtmlhtmllangzh-CNheadmetacharsetUTF-8titleSpring AI 流式输出测试/titlestyle#output{border:1px solid #ccc;padding:15px;min-height:150px;white-space:pre-wrap;font-family:monospace;}button{padding:8px 16px;margin:5px;cursor:pointer;}/style/headbodyh2多模型流式对话测试/h2inputtypetextidmsgInputvalue用五句话聊一聊苏轼stylewidth:300px;buttononclickstartStream(openai)OpenAI/buttonbuttononclickstartStream(qwen)通义千问/buttonbuttononclickstartStream(deepseek)DeepSeek/buttonbuttononclickstartStream(ollama)Ollama/buttondividoutput等待输入.../divscriptletcurrentEventSourcenull;functionstartStream(provider){constmsgdocument.getElementById(msgInput).value;constoutputDivdocument.getElementById(output);// 1. 关闭上一次的连接防止流冲突if(currentEventSource)currentEventSource.close();outputDiv.innerHTML;// 2. 建立 SSE 连接consturl/ai/stream/${provider}?msg${encodeURIComponent(msg)};currentEventSourcenewEventSource(url);// 3. 监听消息实现打字机追加效果currentEventSource.onmessage(event){outputDiv.innerHTMLevent.data;// 自动滚动到底部outputDiv.scrollTopoutputDiv.scrollHeight;};// 4. 监听完成或错误currentEventSource.onerror(){currentEventSource.close();};}/script/body/html五、运行与验证启动 Spring Boot 应用。使用浏览器访问 http://localhost:8080/stream-test.html点击不同的模型按钮你会看到文字像真人打字一样逐字出现在屏幕上。六、本章总结通过本章的实战我们仅用 .stream().content() 这一行核心代码就打通了从大模型到前端的流式数据链路。对后端而言响应式编程避免了长文本生成时的线程阻塞单台服务器即可支撑成千上万个并发流式连接。对前端而言浏览器原生的 EventSource API 完美契合 SSE 协议无需引入任何第三方 WebSocket 库。至此我们的 AI 应用已经具备了“多模型路由”与“丝滑流式输出”两大核心能力。六、参考文献SpringAI官方文档

Allegro PCB Layout新手避坑指南：从视图操作到网络高亮的10个实用技巧

Allegro PCB Layout新手避坑指南：从视图操作到网络高亮的10个实用技巧刚接触Allegro进行PCB设计的工程师，往往会被其强大的功能和复杂的界面所震撼。与一些入门级EDA工具不同，Allegro作为专业级PCB设计软件，其操作逻辑和功能深度都…

2026/6/13 2:01:07 阅读更多

MATLAB通信仿真避坑指南：手把手教你绘制AMI码的误码率曲线（含完整代码）

MATLAB通信仿真实战：AMI码误码率曲线绘制全流程解析通信系统仿真中，误码率曲线是评估传输性能的核心指标。对于交替传号反转码（AMI）这种经典的三电平编码方案，其误码率特性分析往往成为课程设计和项目开发中的关键环节…

2026/6/13 2:01:07 阅读更多

ClamAV扫不出病毒？可能是你没用对！从clamscan到clamdscan的实战对比与性能调优指南

ClamAV性能调优实战：从clamscan到clamdscan的深度对比与场景化配置在Linux服务器安全防护领域，ClamAV以其开源免费的特性成为众多系统管理员的首选反病毒工具。但很多用户在使用过程中常遇到扫描速度慢、资源占用高等性能问题，却不知道问题根…

2026/6/13 1:59:06 阅读更多

WPS JS宏窗体控件实战：从零做一个带下拉筛选的数据查询工具

WPS JS宏窗体控件实战：从零做一个带下拉筛选的数据查询工具在办公自动化场景中，数据查询是最常见也最繁琐的任务之一。想象一下：每次都要在数百行的表格中手动筛选特定部门或日期的数据，不仅效率低下，还容易出错。而WP…

2026/6/13 3:43:18 阅读更多

SpringMVC 入门到实战异常处理 83-85

SpringMVC 入门到实战异常处理 83-85 一、参考资料【SpringMVC教程，一套快速上手spring mvc，springmvc入门到实战】 https://www.bilibili.com/video/BV1Ry4y1574R/?p84&share_sourcecopy_web&vd_source855891859b2dc554eace9de3f28b4528 二、…

2026/6/13 3:43:18 阅读更多

微信小程序发布后，用户为啥总用着旧版？一个 checkUpdateVersion 函数帮你搞定所有更新逻辑

微信小程序版本更新困境：如何用 checkUpdateVersion 函数彻底解决用户滞留旧版问题每次发布微信小程序新版本后，最令人头疼的莫过于发现大量用户仍然在使用旧版本。这种情况不仅影响新功能的推广，还可能导致用户遇到本已修复的bug。作为开发者…

2026/6/13 3:41:57 阅读更多

＜p＞抚顺的街头巷尾，贵金属回收店铺星罗棋布，从黄金、白银到铂金，各类回收需求日益旺盛。为了帮大家拨云见日，找到真正靠谱的服务商，小编不辞辛劳，精心梳理了一份关于抚顺本地诚信回收店铺的参考指南。以下便

福州作为福建省的省会城市，贵金属回收市场向来鱼龙混杂，不少市民在出手黄金、白银或铂金时，最怕遇到压价、扣秤甚至调包等糟心事。为了方便大家找到真正靠谱的回收渠道，小编特意实地探访并多方核实，整理出一份关于福州…

2026/6/13 3:39:56 阅读更多

2026抚顺市权威认证贵金属回收 TOP5+黄金回收白银回收铂金回收门店地址电话推荐

抚顺的街头巷尾，贵金属回收店铺星罗棋布，从黄金、白银到铂金，各类回收需求日益旺盛。为了帮大家拨云见日，找到真正靠谱的服务商，小编不辞辛劳，精心梳理了一份关于抚顺本地诚信回收店铺的参考指南。以下便是…

2026/6/13 3:39:56 阅读更多

生态模型数据准备：如何用GLASS LAI月度最大值数据驱动你的模型（以VIC/SWAT为例）

生态模型数据准备：GLASS LAI月度最大值数据在VIC/SWAT模型中的实战应用当叶面积指数（LAI）数据需要从科研数据集转化为生态水文模型的驱动参数时，大多数教程止步于基础数据处理，却对关键的"最后一公里"语焉不…

2026/6/13 3:38:55 阅读更多

【课程设计/毕业设计】基于 SpringBoot 的患者就诊信息管理系统的设计与实现基于 SpringBoot 的医生接诊与处方管理系统的设计与实现【附源码、数据库、万字文档】

博主介绍：✌️码农一枚 ，专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围：&am…

2026/6/13 0:00:11 阅读更多

numb.nvim 常见问题解答：从安装到使用的 10 个实用技巧

numb.nvim 常见问题解答：从安装到使用的 10 个实用技巧【免费下载链接】numb.nvim Peek lines just when you intend 项目地址: https://gitcode.com/gh_mirrors/nu/numb.nvim numb.nvim 是 Neovim 编辑器中最实用的预览插件之一，它能在你输入 :…

2026/6/13 0:00:11 阅读更多

从MOS管到变压器：手把手教你用LTspice仿真分析功率器件中的寄生电容效应

从MOS管到变压器：用LTspice深度解析功率器件寄生电容效应当你在调试一个Buck变换器时，是否遇到过开关波形出现异常振铃？或者发现效率比理论计算低了5%却找不到原因？这些问题的罪魁祸首往往就藏在那些看不见的寄生电容里。作为硬件…

2026/6/13 0:02:12 阅读更多

LED驱动技术全解析：从核心架构到实战选型与避坑指南

1. 从一颗灯珠到千亿市场：LED驱动的技术演进与商业逻辑十几年前，当我第一次从料盘上拿起一颗0603封装的白色LED时，它微弱的光晕和高达几块钱的单颗成本，让我很难想象今天它几乎照亮了我们生活的每一个角落。从手机屏幕的一抹背光&…

2026/6/13 1:13:48 阅读更多

索引堆及其优化

索引堆及其优化引言索引堆是一种数据结构，广泛应用于计算机科学和软件工程领域。它主要用于解决优先队列问题，如最小堆和最大堆。本文将详细介绍索引堆的概念、实现方法以及优化策略。索引堆的定义索引堆是一种基于堆数据结构的索引机制。它通过维护一个堆来存储数据…

2026/6/13 1:13:46 阅读更多

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

更多请点击： https://intelliparadigm.com 第一章：CSDN AI 数字营销的官方引流卡片是什么功能？ CSDN AI 数字营销平台推出的「官方引流卡片」，是一种面向技术创作者的轻量级、可嵌入式内容分发组件，专为提升博文、教程…

2026/6/13 1:13:45 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/12 10:26:09 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/12 10:00:48 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/12 10:00:17 阅读更多

相关文章