Spring AI Alibaba 模型全家桶：接入通义、百川、LLaMA 等第三方 LLM

发布时间：2026/5/27 16:56:39

上篇我们学会了用工作流编排多个 AI 任务但有一个问题遗留了下来所有 AI 节点都共用同一个模型。如果我想让逻辑推理用 DeepSeek中文润色用通义千问本地快速响应用 LLaMA怎么办今天这篇就是答案——用 Spring AI Alibaba 的多模型切换能力让你在一套代码里自由组合各大模型真正做到“一个项目全家桶模型随心配”。Spring AI 设计的核心原则之一就是“统一 API灵活适配”。你在前几篇中学到的ChatClient、Prompt、Stream等调用方式在与不同模型交互时完全一致。Spring AI Alibaba 不仅原生集成了通义千问还通过 Spring AI 的抽象层兼容了 OpenAI 格式的云端模型如百川、Moonshot和本地 Ollama 模型如 LLaMA。今天我们就来搭建一个“模型全家桶”项目让同一套业务代码可以根据需求动态选择底层大模型。一、痛点场景一家模型不够用的时候场景一多模型对比选型你们团队想评估通义千问、百川和本地 LLaMA 在客服场景下的表现。如果用三套不同的代码分别对接不仅开发量大而且业务逻辑一旦调整三套代码都得改。场景二按任务分派模型你的应用中有三种任务复杂推理交给 DeepSeek中文内容生成交给通义千问而一些简单的本地分类任务为了节约成本使用 LLaMA 3。你需要一个“调度中心”能根据任务类型自动路由到不同模型。场景三容灾与降级当某个云端模型服务出现故障或触发限流时你希望自动切换到备用模型保证服务可用性。这要求你的代码和模型之间是完全解耦的。这些需求都可以用 Spring AI 的多模型管理能力优雅解决。思路是为每个模型创建不同的ChatClientBean然后通过一个路由层根据策略选择调用哪一个。业务代码只需要和路由层交互完全不用关心底层是哪个模型。二、核心概念快览2.1 Spring AI 的统一模型抽象无论是 OpenAI、Azure OpenAI、Ollama 还是 DashScope只要它们实现了ChatModel接口Spring AI 就能将它们作为“可插拔”的组件集成。ChatClient是对ChatModel的再封装提供流式调用和 Advisor 支持。我们之前一直使用的就是ChatClient。2.2 Spring AI Alibaba 中的 DashScope 模型spring-ai-alibaba-starter-dashscope会自动创建DashScopeChatModel并注册为ChatModel和ChatClientBean。这就是通义千问的接入方式。2.3 兼容 OpenAI 接口的第三方模型百川、Moonshot、DeepSeek、零一万物等大量国产模型提供商都提供与 OpenAI 兼容的 HTTP API。在 Spring AI 中只要它们返回的 JSON 格式兼容 OpenAI Chat Completions 协议我们就可以使用spring-ai-starter-model-openai来接入只需更改base-url和api-key。2.4 本地 Ollama 模型之前第 7 篇我们详细讲过。它通过spring-ai-starter-model-ollama接入同样产生一个ChatModel实现。2.5 多模型路由策略最简单的路由是基于模型名称手动选择。你可以创建一个MapString, ChatClient根据前端传来的参数或任务类型从 Map 中取出对应的ChatClient调用。更高级的玩法是利用 Spring AI 的未来功能如ModelRouter但目前用 Map 已经足够实用。三、环境准备3.1 API Key 汇总由于要同时接入多个云端模型你需要准备至少两个 API Key通义千问百炼DASHSCOPE_API_KEY百川或其他兼容 OpenAI 的模型BAICHUAN_API_KEY百川、Moonshot 等平台的 API Key 获取方式类似在各自开放平台注册即可。本地 LLaMA 则需要安装 Ollama 并拉取模型参考第 7 篇。3.2 Maven 依赖我们需要在一个项目中同时引入 DashScope、OpenAI 和 Ollama 三个 starter而且还要管理好它们的版本。核心依赖propertiesspring-ai.version1.1.6/spring-ai.versionspring-ai-alibaba.version1.1.2.0/spring-ai-alibaba.version/propertiesdependencies!-- Spring Boot Web --dependencygroupIdorg.springframework.boot/groupIdartifactIdspring-boot-starter-web/artifactId/dependency!-- DashScope Starter通义千问 --dependencygroupIdcom.alibaba.cloud.ai/groupIdartifactIdspring-ai-alibaba-starter-dashscope/artifactIdversion${spring-ai-alibaba.version}/version/dependency!-- OpenAI Starter用于百川等兼容 OpenAI 的模型 --dependencygroupIdorg.springframework.ai/groupIdartifactIdspring-ai-starter-model-openai/artifactId/dependency!-- Ollama Starter本地 LLaMA 等 --dependencygroupIdorg.springframework.ai/groupIdartifactIdspring-ai-starter-model-ollama/artifactId/dependency/dependenciesdependencyManagementdependenciesdependencygroupIdorg.springframework.ai/groupIdartifactIdspring-ai-bom/artifactIdversion${spring-ai.version}/versiontypepom/typescopeimport/scope/dependency/dependencies/dependencyManagement注意这三个 starter 会分别注册各自的自动配置包括ChatModel和ChatClientBean。为了防止冲突我们不能直接通过Autowired ChatClient注入那样会因为有多个 Bean 而报错。我们需要使用Qualifier或者更简单的方式手动为每个模型创建独立的ChatClientBean并给予有意义的名字。3.3 多模型配置文件在application.yml中我们必须为不同的模型使用不同的配置前缀。由于 Spring AI 只允许一套spring.ai.openai和一套spring.ai.ollama而我们接入百川也要用 OpenAI 的 starter这就需要用不同的环境配置或手动创建 Bean 来区分。最简单的方法是不为百川使用自动配置而是手动构造一个OpenAiChatModel指定独立的 base-url 和 api-key。因此配置文件里只保留 DashScope 和 Ollama 的自动配置百川的配置我们通过硬编码从环境变量读取在 Bean 中创建。spring:ai:dashscope:api-key:${DASHSCOPE_API_KEY}chat:options:model:qwen-plustemperature:0.7ollama:base-url:http://localhost:11434chat:options:model:llama3:8btemperature:0.7四、代码实战4.1 创建多个 ChatClient Bean新建MultiModelConfig.javapackagecom.example.springaihelloworld.config;importorg.springframework.ai.chat.client.ChatClient;importorg.springframework.ai.openai.OpenAiChatModel;importorg.springframework.ai.openai.OpenAiChatOptions;importorg.springframework.ai.openai.api.OpenAiApi;importorg.springframework.ai.chat.model.ChatModel;importorg.springframework.beans.factory.annotation.Qualifier;importorg.springframework.context.annotation.Bean;importorg.springframework.context.annotation.Configuration;ConfigurationpublicclassMultiModelConfig{// 自动配置的 ChatModel Bean 名称// DashScope ChatModel Bean 名称为 dashScopeChatModel// Ollama ChatModel Bean 名称为 ollamaChatModel/** * 通义千问 ChatClient使用 DashScope 自动配置的 ChatModel */BeanpublicChatClientqwenChatClient(Qualifier(dashScopeChatModel)ChatModelchatModel){returnChatClient.create(chatModel);}/** * 百川 ChatClient手动构建 OpenAiChatModel使用百川兼容 API */BeanpublicChatClientbaichuanChatClient(){StringapiKeySystem.getenv(BAICHUAN_API_KEY);if(apiKeynull){thrownewIllegalStateException(BAICHUAN_API_KEY 环境变量未设置);}OpenAiApibaichuanApinewOpenAiApi(https://api.baichuan-ai.com/v1,apiKey);ChatModelbaichuanModelOpenAiChatModel.builder().openAiApi(baichuanApi).defaultOptions(OpenAiChatOptions.builder().withModel(Baichuan4)// 百川模型名.withTemperature(0.7f).build()).build();returnChatClient.create(baichuanModel);}/** * 本地 LLaMA ChatClient使用 Ollama 自动配置的 ChatModel */BeanpublicChatClientllamaChatClient(Qualifier(ollamaChatModel)ChatModelchatModel){returnChatClient.create(chatModel);}}关键点解读通过Qualifier指定要注入哪一个ChatModelBean。自动配置的 Bean 名称通常在官方文档中会有说明或者你可以通过查看DashScopeAutoConfiguration和OllamaAutoConfiguration源码来确认。这里假设 DashScope 的 ChatModel Bean 名为dashScopeChatModelOllama 的为ollamaChatModel。如果名称不同请根据实际情况调整或者直接Autowired MapString, ChatModel查看所有 Bean 名称。百川的接入没有使用自动配置而是手动构建OpenAiApi和OpenAiChatModel这样就不会和默认的 OpenAI 配置冲突且可以自由指定 base-url 和 api-key。4.2 创建模型路由服务新建ModelRoutingService.java用 Map 存储所有模型对应的 ChatClientpackagecom.example.springaihelloworld.service;importorg.springframework.ai.chat.client.ChatClient;importorg.springframework.stereotype.Service;importreactor.core.publisher.Flux;importjava.util.Map;ServicepublicclassModelRoutingService{privatefinalMapString,ChatClientmodelMap;/** * 构造器注入所有 ChatClient Bean通过名字区分 */publicModelRoutingService(ChatClientqwenChatClient,ChatClientbaichuanChatClient,ChatClientllamaChatClient){this.modelMapMap.of(qwen,qwenChatClient,baichuan,baichuanChatClient,llama,llamaChatClient);}/** * 同步对话 * param model 模型标识qwen / baichuan / llama */publicStringchat(Stringmodel,Stringmessage){ChatClientclientgetClient(model);returnclient.prompt().user(message).call().content();}/** * 流式对话 */publicFluxStringstreamChat(Stringmodel,Stringmessage){ChatClientclientgetClient(model);returnclient.prompt().user(message).stream().content();}privateChatClientgetClient(Stringmodel){ChatClientclientmodelMap.get(model);if(clientnull){thrownewIllegalArgumentException(不支持的模型: model可用模型: modelMap.keySet());}returnclient;}}4.3 创建路由 Controllerpackagecom.example.springaihelloworld.controller;importcom.example.springaihelloworld.service.ModelRoutingService;importorg.springframework.http.MediaType;importorg.springframework.web.bind.annotation.*;importreactor.core.publisher.Flux;RestControllerpublicclassModelRoutingController{privatefinalModelRoutingServiceroutingService;publicModelRoutingController(ModelRoutingServiceroutingService){this.routingServiceroutingService;}/** * 统一对话入口通过 model 参数切换底层模型 * GET /chat?modelqwenmsg你好 */GetMapping(/chat)publicStringchat(RequestParam(defaultValueqwen)Stringmodel,RequestParamStringmsg){returnroutingService.chat(model,msg);}/** * 流式对话入口 * GET /chat/stream?modelbaichuanmsg你好 */GetMapping(value/chat/stream,producesMediaType.TEXT_EVENT_STREAM_VALUE)publicFluxStringstreamChat(RequestParamStringmodel,RequestParamStringmsg){returnroutingService.streamChat(model,msg);}}现在调用者只需在请求中指定model参数就能在通义千问、百川、本地 LLaMA 之间自由切换。对业务代码来说切换模型就是一个参数的选择没有任何 if-else 的侵入。五、运行与演示5.1 启动项目确保DASHSCOPE_API_KEY、BAICHUAN_API_KEY已设置Ollama 本地服务已启动且已拉取llama3:8b模型。启动 Spring Boot。5.2 分别测试三个模型通义千问http://localhost:8080/chat?modelqwenmsg简单介绍你自己返回类似我是通义千问由阿里云自主研发的大语言模型...百川http://localhost:8080/chat?modelbaichuanmsg简单介绍你自己返回类似我是百川智能研发的大语言模型...本地 LLaMAhttp://localhost:8080/chat?modelllamamsg简单介绍你自己返回类似I am LLaMA, an AI assistant created by Meta...可以看到同一个接口/chat只是改变model参数底层调用的模型就完全不一样了。5.3 体验流式切换http://localhost:8080/chat/stream?modelbaichuanmsg讲一个简短的笑话使用 curl 观察打字机效果和之前的流式体验完全一致。六、常见问题与避坑提示问题一启动时提示多个 ChatClient Bean 冲突如果你之前在别的地方直接用Autowired ChatClient注入了 BeanSpring 会因为找到多个候选 Bean 而报错。解决方案是使用Qualifier指定名称或者在用到的地方注入我们手动创建的具名 Bean。本文的设计不会出现这个问题因为所有 ChatClient 都有明确的 Bean 名称。问题二自动配置的 ChatModel Bean 名称不确定DashScope 的自动配置类名为DashScopeAutoConfiguration它注册的 ChatModel Bean 名称通常为dashScopeChatModel。Ollama 的为ollamaChatModel。如果你不确定可以在Bean方法中使用Autowired MapString, ChatModel chatModels打印所有 Bean 名称来确定。问题三百川 API Key 环境变量未设置导致启动失败我们的baichuanChatClientBean 在创建时强制检查环境变量如果未设置则抛异常阻止启动。这在生产中是合理的但如果你暂时不想用百川可以移除该 Bean 或者改为 Optional 注入。问题四Ollama 模型未下载导致调用失败如果本地没有llama3:8b模型调用会报错。请先执行ollama pull llama3:8b。也可以更换为其他你已下载的模型只需在配置文件中修改model名称。问题五多模型计费与监控不同模型的计费标准不同在生产环境中建议在路由层加入调用次数和 Token 消耗的监控方便成本分析。Spring AI 的ChatResponse中包含getMetadata()可以获取 Token 使用信息。七、小结与下一步预告本篇回顾理解了多模型接入的场景价值对比选型、任务分派、容灾降级。掌握了在单个 Spring Boot 项目中同时管理多个模型的技巧手动为每个模型创建具名ChatClientBean。实现了基于参数的路由切换业务代码与具体模型完全解耦。分别演示了通义千问、百川、本地 LLaMA 三种模型的无缝切换。动手建议在你的项目中找出至少两个适用不同模型的任务如内容生成和代码审查用本文的路由模式接入对应的模型体验“一个项目多模协同”的开发效率。下一步预告多模型切换已经实现但每个模型的能力边界不同还有些原生高级功能如百炼的函数调用、参数调优我们还没深入挖掘。下一篇我们将进入Spring AI Alibaba 进阶聚焦 DashScope 的原生能力与生产环境最佳实践让你的百炼应用更稳定、更高效。下一篇《Spring AI Alibaba 进阶DashScope 原生能力与最佳实践》见。本系列博客基于 Spring AI 1.1.6 和 Spring AI Alibaba 1.1.2.0 版本编写。各第三方模型的 API 地址和模型名称可能随平台更新而调整请以官方文档为准。多模型共存时请注意依赖版本兼容建议通过 BOM 统一管理。

【ChatGPT面试题设计黄金法则】：20年HR Tech专家首曝5类高区分度问题及避坑清单

更多请点击： https://intelliparadigm.com 第一章：ChatGPT面试题设计的核心价值与范式演进在AI驱动的技术招聘实践中，ChatGPT面试题设计已超越传统“知识测验”定位，演进为评估候选人系统思维、调试直觉与工程权衡能力的关键载体…

2026/5/27 16:55:55 阅读更多

SKILL.md 高级编写技巧与最佳实践

SKILL.md 高级编写技巧与最佳实践引言 SKILL.md 是 Agent Skills 的核心文件，它不仅是技能的说明书，更是 AI 代理理解和执行任务的蓝图。掌握高级编写技巧可以让您创建更强大、更灵活、更易于维护的技能。一、元数据字段深度解析基础元数据 --- name:…

2026/5/27 16:55:55 阅读更多

【AI时代绩效革命】：首次公开——ChatGPT岗位胜任力雷达图（含6项硬指标+3项灰度阈值）

更多请点击： https://codechina.net 第一章：ChatGPT岗位胜任力雷达图的底层逻辑与范式迁移 ChatGPT岗位胜任力雷达图并非传统能力评估工具的简单可视化延伸，而是以大语言模型（LLM）驱动的岗位语义解构为前提&#xff0…

2026/5/27 16:55:34 阅读更多

FModel终极指南：三步掌握免费虚幻引擎游戏资源提取神器

FModel终极指南：三步掌握免费虚幻引擎游戏资源提取神器【免费下载链接】FModel Unreal Engine Archives Explorer 项目地址: https://gitcode.com/gh_mirrors/fm/FModel 你是否曾经好奇过《堡垒之夜》的炫酷皮肤是如何设计的？或者想了解《Valora…

2026/5/27 17:57:51 阅读更多

30行YAML实现AI代码审查：从月费600美元到8美元的降本实践

1. 项目概述：从昂贵的SaaS工具到30行YAML的转变上个月，我们团队还在为一个AI代码审查工具每月支付600美元。平摊下来，每个开发者席位是60美元。平心而论，这个工具本身不差，该有的功能都有，界面也还算友好。…

2026/5/27 17:57:07 阅读更多

如何在 openclaw 中快速配置 taotoken 的聚合 api 端点

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度如何在 OpenClaw 中快速配置 Taotoken 的聚合 API 端点基础教程类，面向使用 OpenClaw 进行 AI 应用开发的开发者&…

2026/5/27 17:56:24 阅读更多

LaWGPT法律大模型实战指南：从零部署到专业应用的完整方案

LaWGPT法律大模型实战指南：从零部署到专业应用的完整方案【免费下载链接】LaWGPT 🎉 Repo for LaWGPT, Chinese-Llama tuned with Chinese Legal knowledge. 基于中文法律知识的大语言模型项目地址: https://gitcode.com/gh_mirrors/la/LaWGPT …

2026/5/27 17:55:21 阅读更多

从零开始使用paraphrase-MiniLM-L12-v2：中文语义搜索完整实现指南

从零开始使用paraphrase-MiniLM-L12-v2：中文语义搜索完整实现指南【免费下载链接】paraphrase-MiniLM-L12-v2 项目地址: https://ai.gitcode.com/hf_mirrors/HangZhou_Ascend/paraphrase-MiniLM-L12-v2 paraphrase-MiniLM-L12-v2是一款高效的中文语义搜索工…

2026/5/27 17:55:00 阅读更多

混合现实混合用户界面设计：八维框架解析与工程实践指南

1. 混合现实混合用户界面：从概念到设计空间的深度解析如果你是一名交互设计师、XR开发者，或者对下一代计算界面充满好奇，那么“混合现实混合用户界面”这个概念，可能正代表着我们未来与数字世界交互的核心范式。它远不止是戴上头显…

2026/5/27 17:55:00 阅读更多

LVGL绘制平滑曲线避坑指南：为什么你的贝塞尔函数有毛刺？

LVGL绘制平滑曲线避坑指南：为什么你的贝塞尔函数有毛刺？ 在嵌入式GUI开发中，贝塞尔曲线是实现流畅动画和优雅界面的核心工具。但许多开发者在使用LVGL绘制曲线时，总会遇到令人头疼的锯齿和毛刺问题。这背后隐藏着嵌入式设备特有的…

2026/5/27 0:00:16 阅读更多

告别手动输入！用Burpsuite插件captcha-killer-modified+ddddocr，5分钟搞定登录爆破验证码

自动化验证码识别实战：Burpsuite与ddddocr的高效联动方案验证码机制作为现代Web应用的基础安全防线，其对抗自动化攻击的能力直接影响系统安全性。但在安全测试领域，验证码往往成为效率瓶颈——传统手工识别方式让渗透测试人员每天浪费数小时在…

2026/5/27 0:00:36 阅读更多

中国AI岗位暴涨12倍，13种你没听过的AI岗位

2026年，中国AI岗位数量同比增长12倍，AI科学家月薪高达13.7万，高性能计算工程师出现“7个岗位抢1个人”的荒诞场面。与此同时，数据录入、基础财务分析、一线客服等岗位大幅下降。全球范围内，AI/ML岗位招聘量同比增长88%…

2026/5/27 0:03:59 阅读更多

施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录

更多请点击： https://codechina.net 第一章：施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录在华北某大型地铁盾构施工现场，一套轻量化AI Agent系统于2024年Q2完成全栈部署&#xff…

2026/5/27 3:41:47 阅读更多

附录 B：术语表

本术语表面向“从 MM 到 HMM”专栏阅读过程中的快速查阅。它不是内核 API 手册，而是把文章中反复出现的概念放到同一张地图上：先给出直观含义，再说明它在 Linux MM/HMM 语境里的作用。建议阅读方式： 初读专栏时，把它当…

2026/5/27 3:04:04 阅读更多

Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表·行业首曝）

更多请点击： https://kaifayun.com 第一章：Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表行业首曝） Midjourney 的渐变美学并非传统插值实现，而是由其隐式神经渲染器（Implicit Neu…

2026/5/27 2:28:22 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/26 19:57:06 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/27 15:51:09 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/27 12:55:08 阅读更多

相关文章