本文档记录了在Windows 环境下使用Docker Desktop部署Dify并接入Ollama本地大模型的完整步骤适用于构建本地 AI 应用开发环境。一、环境准备1.1 硬件与系统要求项目最低配置推荐配置操作系统Windows 10 21H2Windows 11CPU4核8核内存16GB32GB硬盘50GB100GB显卡无NVIDIA GPU支持CUDAWSL 2已安装已安装并配置好1.2 安装 Docker Desktop访问 Docker Desktop 官网 下载 Windows 版本。双击安装包勾选“使用 WSL 2 代替 Hyper-V”。安装完成后重启电脑。启动 Docker Desktop等待左下角状态变为绿色Running。1.3 配置国内镜像加速Docker Desktop → Settings → Docker Engine{ registry-mirrors: [ https://docker.1ms.run, https://docker.m.daocloud.io, https://dockerproxy.com, https://hub-mirror.c.163.com ] }点击Apply Restart使配置生效。二、Dify 部署2.1 克隆代码并启动# 克隆 Dify 仓库 git clone https://github.com/langgenius/dify.git cd dify # 进入 docker 目录并复制环境配置文件 cd docker cp .env.example .env # 启动所有服务 docker compose up -d首次启动需要下载镜像时间较长取决于网络建议配置好镜像加速器。2.2 验证服务状态docker compose ps所有服务应显示Up状态包括api-1、worker-1、nginx-1、web-1等。2.3 访问 Dify 控制台浏览器打开http://localhost首次访问进入初始化页面设置管理员邮箱和密码即可登录。三、Ollama 安装与模型下载3.1 安装 Ollama访问 Ollama 官网 下载 Windows 版本安装包安装完成后在系统托盘任务栏右下角会出现 Ollama 图标羊驼。3.2 下载大模型打开 CMD 或 PowerShell 执行# 下载 7B 模型约 4.7GB适合有 GPU 或追求准确率的场景 ollama pull qwen2.5:7b # 或下载 1.5B 模型约 1.2GB速度较快适合无 GPU 场景 ollama pull qwen2.5:1.5b # 查看已下载的模型列表 ollama list # 查看模型运行状态 ollama ps3.3 验证 Ollama 服务curl http://localhost:11434/api/generate -d {\model\: \qwen2.5:7b\, \prompt\: \你好\, \stream\: false}返回 JSON 响应即表示服务正常。四、Dify 接入 Ollama4.1 进入模型配置页面Dify 控制台 → 右上角头像 →设置→模型供应商4.2 添加 Ollama 模型找到Ollama卡片点击“添加模型”配置项填写内容模型类型LLM对话模型名称qwen2.5:7b与ollama list显示的完全一致基础 URLhttp://host.docker.internal:11434API 密钥随意填写如ollama上下文大小131072建议根据模型填写最大 token 上限4096是否支持 Vision否是否支持函数调用否⚠️关键点基础 URL 必须填写http://host.docker.internal:11434因为 Dify 运行在 Docker 容器内需要用此地址访问宿主机的 Ollama 服务。4.3 保存并验证点击“保存”保存成功即表示连接已建立。五、创建工作流5.1 创建空白工作流Dify 左侧菜单 →工作室→创建空白应用→ 选择“工作流”类型 → 命名如health-report-parser5.2 配置 LLM 节点从左侧拖拽LLM节点到画布连接“开始”节点。配置节点模型选择已添加的qwen2.5:7b上下文引用开始节点中的report_text变量5.3 编写提示词Prompt系统提示词你是一个专业的体检报告解析助手擅长从体检报告中提取关键健康指标。用户提示词请从以下体检报告文本中提取被检人基本信息姓名、性别、年龄、电话、身份证号、体检日期和体检指标白细胞、血红蛋白、血小板、收缩压、舒张压、总胆固醇、甘油三酯、空腹血糖、肌酐、尿素氮、尿酸、同型半胱氨酸、心电图结论、胸部DR结论以 JSON 格式输出。 报告文本{{report_text}}5.4 发布工作流点击右上角“保存”→“发布”。5.5 获取 API 密钥左侧菜单 →“访问API”→“API 密钥”→“创建新的 API 密钥”复制保存格式app-xxxxxxxx。六、常见问题排查6.1 Docker Desktop 启动失败wsl -l -v # 查看 docker-desktop 状态 # 如果显示 Stopped执行 wsl -d docker-desktop # 然后重启 Docker Desktop6.2 镜像拉取失败检查 Docker Desktop 是否已配置镜像加速器尝试手动拉取docker pull langgenius/dify-api:1.14.2或者使用手机热点重试6.3 Ollama 连接失败确认 Ollama 已在系统托盘中运行确认 Dify 中使用的是http://host.docker.internal:11434执行curl http://localhost:11434/api/generate验证服务6.4 Dify 中模型无法添加确认模型名称与ollama list完全一致包括大小写尝试在 Ollama 中重新拉取模型6.5 Docker Desktop 无法启动完全退出 Docker Desktop重新启动如果持续报错卸载 Docker Desktop重启电脑重新安装七、快速参考项目地址/命令Dify 控制台http://localhostOllama APIhttp://localhost:11434Dify APIhttp://localhost/v1/workflows/run查看 Dify 容器状态docker compose ps查看 Dify 容器日志docker compose logs -fOllama 命令ollama list/ollama ps/ollama pull {model}验证 Ollamacurl http://localhost:11434/api/generate -d {\model\: \qwen2.5:7b\, \prompt\: \hi\, \stream\: false}八、总结至此你已完成了整套本地 AI 应用开发环境的搭建Docker Desktop容器化运行 DifyDify工作流编排与 API 网关Ollama Qwen2.5本地大模型推理服务这套环境完全运行在本地适合开发调试也适用于对数据隐私有要求的内部应用场景。
Dify + Ollama + Docker Desktop 本地部署配置指南
发布时间:2026/6/26 22:50:25
本文档记录了在Windows 环境下使用Docker Desktop部署Dify并接入Ollama本地大模型的完整步骤适用于构建本地 AI 应用开发环境。一、环境准备1.1 硬件与系统要求项目最低配置推荐配置操作系统Windows 10 21H2Windows 11CPU4核8核内存16GB32GB硬盘50GB100GB显卡无NVIDIA GPU支持CUDAWSL 2已安装已安装并配置好1.2 安装 Docker Desktop访问 Docker Desktop 官网 下载 Windows 版本。双击安装包勾选“使用 WSL 2 代替 Hyper-V”。安装完成后重启电脑。启动 Docker Desktop等待左下角状态变为绿色Running。1.3 配置国内镜像加速Docker Desktop → Settings → Docker Engine{ registry-mirrors: [ https://docker.1ms.run, https://docker.m.daocloud.io, https://dockerproxy.com, https://hub-mirror.c.163.com ] }点击Apply Restart使配置生效。二、Dify 部署2.1 克隆代码并启动# 克隆 Dify 仓库 git clone https://github.com/langgenius/dify.git cd dify # 进入 docker 目录并复制环境配置文件 cd docker cp .env.example .env # 启动所有服务 docker compose up -d首次启动需要下载镜像时间较长取决于网络建议配置好镜像加速器。2.2 验证服务状态docker compose ps所有服务应显示Up状态包括api-1、worker-1、nginx-1、web-1等。2.3 访问 Dify 控制台浏览器打开http://localhost首次访问进入初始化页面设置管理员邮箱和密码即可登录。三、Ollama 安装与模型下载3.1 安装 Ollama访问 Ollama 官网 下载 Windows 版本安装包安装完成后在系统托盘任务栏右下角会出现 Ollama 图标羊驼。3.2 下载大模型打开 CMD 或 PowerShell 执行# 下载 7B 模型约 4.7GB适合有 GPU 或追求准确率的场景 ollama pull qwen2.5:7b # 或下载 1.5B 模型约 1.2GB速度较快适合无 GPU 场景 ollama pull qwen2.5:1.5b # 查看已下载的模型列表 ollama list # 查看模型运行状态 ollama ps3.3 验证 Ollama 服务curl http://localhost:11434/api/generate -d {\model\: \qwen2.5:7b\, \prompt\: \你好\, \stream\: false}返回 JSON 响应即表示服务正常。四、Dify 接入 Ollama4.1 进入模型配置页面Dify 控制台 → 右上角头像 →设置→模型供应商4.2 添加 Ollama 模型找到Ollama卡片点击“添加模型”配置项填写内容模型类型LLM对话模型名称qwen2.5:7b与ollama list显示的完全一致基础 URLhttp://host.docker.internal:11434API 密钥随意填写如ollama上下文大小131072建议根据模型填写最大 token 上限4096是否支持 Vision否是否支持函数调用否⚠️关键点基础 URL 必须填写http://host.docker.internal:11434因为 Dify 运行在 Docker 容器内需要用此地址访问宿主机的 Ollama 服务。4.3 保存并验证点击“保存”保存成功即表示连接已建立。五、创建工作流5.1 创建空白工作流Dify 左侧菜单 →工作室→创建空白应用→ 选择“工作流”类型 → 命名如health-report-parser5.2 配置 LLM 节点从左侧拖拽LLM节点到画布连接“开始”节点。配置节点模型选择已添加的qwen2.5:7b上下文引用开始节点中的report_text变量5.3 编写提示词Prompt系统提示词你是一个专业的体检报告解析助手擅长从体检报告中提取关键健康指标。用户提示词请从以下体检报告文本中提取被检人基本信息姓名、性别、年龄、电话、身份证号、体检日期和体检指标白细胞、血红蛋白、血小板、收缩压、舒张压、总胆固醇、甘油三酯、空腹血糖、肌酐、尿素氮、尿酸、同型半胱氨酸、心电图结论、胸部DR结论以 JSON 格式输出。 报告文本{{report_text}}5.4 发布工作流点击右上角“保存”→“发布”。5.5 获取 API 密钥左侧菜单 →“访问API”→“API 密钥”→“创建新的 API 密钥”复制保存格式app-xxxxxxxx。六、常见问题排查6.1 Docker Desktop 启动失败wsl -l -v # 查看 docker-desktop 状态 # 如果显示 Stopped执行 wsl -d docker-desktop # 然后重启 Docker Desktop6.2 镜像拉取失败检查 Docker Desktop 是否已配置镜像加速器尝试手动拉取docker pull langgenius/dify-api:1.14.2或者使用手机热点重试6.3 Ollama 连接失败确认 Ollama 已在系统托盘中运行确认 Dify 中使用的是http://host.docker.internal:11434执行curl http://localhost:11434/api/generate验证服务6.4 Dify 中模型无法添加确认模型名称与ollama list完全一致包括大小写尝试在 Ollama 中重新拉取模型6.5 Docker Desktop 无法启动完全退出 Docker Desktop重新启动如果持续报错卸载 Docker Desktop重启电脑重新安装七、快速参考项目地址/命令Dify 控制台http://localhostOllama APIhttp://localhost:11434Dify APIhttp://localhost/v1/workflows/run查看 Dify 容器状态docker compose ps查看 Dify 容器日志docker compose logs -fOllama 命令ollama list/ollama ps/ollama pull {model}验证 Ollamacurl http://localhost:11434/api/generate -d {\model\: \qwen2.5:7b\, \prompt\: \hi\, \stream\: false}八、总结至此你已完成了整套本地 AI 应用开发环境的搭建Docker Desktop容器化运行 DifyDify工作流编排与 API 网关Ollama Qwen2.5本地大模型推理服务这套环境完全运行在本地适合开发调试也适用于对数据隐私有要求的内部应用场景。