我用本地大模型给MES工程师做了个个人助理（Ollama+知识库，附完整部署教程）

发布时间：2026/6/11 16:59:52

我在工厂里天天要用MES系统查工单、看良率、追踪批次...以前打开MES系统 → 输入账号密码 → 层层导航 → 找数据 → 导出Excel → 再分析...麻烦死了。后来我搭了个本地大模型助理用自然语言就能查询MES数据。今天ETCH-01的良率是多少 → 直接出结果帮我查一下WAF20240610001这个批次的当前工序 → 2秒出结果为什么用本地部署 MES数据是工厂核心机密不能发到云端。所以必须本地部署。我的选择Ollama免费开源 Llama38B参数8GB显存即可运行硬件要求8GB显存RTX 3060及以上或 Mac M系列芯片软件要求Python 3.9LangChainChromaDB向量数据库架构设计整个系统分3层1. 数据层MES系统的SQL数据库设备手册文档2. 知识层Chroma向量数据库存储文档切片3. 应用层LangChain连接Ollama SQL工具文档检索[配图说明本地大模型助理架构图MES数据库文档 → 向量库 → Ollama/Llama3 → 用户界面]完整部署教程Step 1安装Ollama# Windows/Mac/Linux通用# 官网下载https://ollama.com/download# 或者用命令行安装Mac/Linuxcurl -fsSL https://ollama.com/install.sh | sh# 下载模型Llama3 8B8GB显存够用ollama pull llama3# 测试运行ollama run llama3 你好请介绍一下你自己Step 2构建MES知识库import sqlite3from langchain.document_loaders import DirectoryLoaderfrom langchain.text_splitter import RecursiveCharacterTextSplitterfrom langchain.embeddings import OllamaEmbeddingsfrom langchain.vectorstores import Chroma# 示例把MES数据库的表结构存入知识库conn sqlite3.connect(mes.db)cursor conn.cursor()cursor.execute(SELECT sql FROM sqlite_master WHERE typetable)schemas cursor.fetchall()conn.close()# 把表结构写成文档schema_text \n.join([s[0] for s in schemas if s[0]])with open(mes_schema.txt, w, encodingutf-8) as f:f.write(fMES数据库表结构\n{schema_text})# 加载并拆分文档loader DirectoryLoader(./mes_docs, glob**/*.txt)docs loader.load()splitter RecursiveCharacterTextSplitter(chunk_size300, chunk_overlap30)chunks splitter.split_documents(docs)# 存入向量数据库embeddings OllamaEmbeddings(modelllama3)vectorstore Chroma.from_documents(documentschunks,embeddingembeddings,persist_directory./mes_kb)print(f知识库已构建{len(chunks)}个文档片段)Step 3构建SQL查询ChainText-to-SQLfrom langchain.chains import create_sql_query_chainfrom langchain.chat_models import ChatOllamafrom langchain.utilities import SQLDatabasefrom langchain_experimental.sql import SQLDatabaseChain# 连接MES数据库db SQLDatabase.from_uri(sqlite:///mes.db)# 创建LLMllm ChatOllama(modelllama3, base_urlhttp://localhost:11434)# 创建SQL查询Chaindb_chain create_sql_query_chain(llm, db)# 测试查询question ETCH-01设备今天的产出是多少片result db_chain.invoke({question: question})print(f生成的SQL: {result})实际运行效果问题今天ETCH-01的良率是多少生成的SQL:SELECTROUND(SUM(good_qty) * 100.0 / SUM(output_qty), 2) AS yield_rateFROM mes_productionWHERE equipment_id ETCH-01AND shift_date CURDATE()执行结果: 98.3%---问题帮我查批次WAF20240610001当前在哪道工序生成的SQL:SELECTb.lot_id,m.process_name,m.step_name,m.start_timeFROM mes_lot_flow bJOIN mes_process m ON b.current_process_id m.process_idWHERE b.lot_id WAF20240610001执行结果:lot_idWAF20240610001, 刻蚀工序, ETCH-03腔室1, 2026-06-11 14:23:15[配图说明本地大模型助理运行截图自然语言查询SQL执行结果]工程化做个简单的Web界面# 使用Gradio快速做界面pip install gradioimport gradio as grfrom langchain.chains import create_sql_query_chainfrom langchain.chat_models import ChatOllamafrom langchain.utilities import SQLDatabasedb SQLDatabase.from_uri(sqlite:///mes.db)llm ChatOllama(modelllama3, base_urlhttp://localhost:11434)db_chain create_sql_query_chain(llm, db)def query_mes(question):try:sql db_chain.invoke({question: question})# 执行SQL简化版实际需要安全处理result db.execute(sql).fetchall()return fSQL: {sql}\n\n结果: {result}except Exception as e:return f查询失败: {str(e)}# 启动Web界面gr.Interface(fnquery_mes,inputstext,outputstext,titleMES数据查询助手,description用自然语言查询MES数据本地部署数据安全).launch(server_name0.0.0.0, server_port7860)[配图说明Gradio Web界面截图输入框查询结果展示]总结与注意事项⚠️ 部署前必读1. 数据安全所有数据都在本地不用担心泄露2. SQL注入实际使用必须对SQL执行做权限控制不要让LLM随意增删改3. 模型选择Llama3 8B够用追求精度可以用70B需要40GB显存4. 更新知识库MES结构变化时要同步更新向量数据库实测效果日常查询从5分钟→10秒数据分析效率提升30倍。--- 你们厂的MES系统好用吗有没有想过用AI改造评论区聊聊觉得有用点赞收藏关注我一起探索AI在制造业的落地

MCprep：让Blender中的Minecraft创作从繁琐到高效的革命性工具

MCprep：让Blender中的Minecraft创作从繁琐到高效的革命性工具【免费下载链接】MCprep Blender python addon to increase workflow for creating minecraft renders and animations 项目地址: https://gitcode.com/gh_mirrors/mc/MCprep 你是否曾经想过将Mi…

2026/6/11 16:59:11 阅读更多

深入解析MPC875/870通信处理器：架构、硬件设计与实战优化

1. 项目概述与核心价值在嵌入式系统，尤其是通信和网络设备的设计领域，选对一颗“心脏”级别的处理器，往往决定了整个项目的成败。今天要聊的MPC875和MPC870，就是飞思卡尔（Freescale，现为NXP）Pow…

2026/6/11 16:59:11 阅读更多

D2UNet：双解码器协同与纹理变形模块，如何重塑地震图像超分辨率重建？

1. 地震图像超分辨率重建的挑战与机遇地震勘探是石油天然气资源勘探的重要手段，而地震图像的质量直接决定了地质解释的准确性。在实际工作中，我们常常会遇到低分辨率、高噪声的地震数据，这给后续的地层识别、断层检测等关键任务带来了巨大困…

2026/6/11 16:58:31 阅读更多

洛雪音乐助手架构深度解析：现代Electron应用的多源音乐聚合方案

洛雪音乐助手架构深度解析：现代Electron应用的多源音乐聚合方案【免费下载链接】lx-music-desktop 一个基于 Electron 的音乐软件项目地址: https://gitcode.com/GitHub_Trending/lx/lx-music-desktop 在当前数字音乐服务日益碎片化的背景下，音…

2026/6/11 18:26:10 阅读更多

MPC8360E/8358E硬件设计：从芯片手册解读到PCB实战指南

1. 项目概述：从芯片手册到硬件设计的桥梁在嵌入式系统，尤其是通信处理器领域，硬件设计从来不是简单的“连线游戏”。每一根信号线背后，都隐藏着电压、电流、时间等一系列严格的物理约束。飞思卡尔（现为NXP）…

2026/6/11 18:26:10 阅读更多

终极解决方案：如何快速降低腾讯游戏卡顿问题

终极解决方案：如何快速降低腾讯游戏卡顿问题【免费下载链接】sguard_limit 限制ACE-Guard Client EXE占用系统资源，支持各种腾讯游戏项目地址: https://gitcode.com/gh_mirrors/sg/sguard_limit 你是否在玩腾讯游戏时经常遇到莫名其妙的卡顿、掉…

2026/6/11 18:25:10 阅读更多

【零基础小白可用】本地 AI 数字员工 OpenClaw 2.7.9 安装指南（含最新安装包）

Windows 一键部署 OpenClaw 教程｜5 分钟搞定本地 AI 智能体，告别复杂配置核心亮点：零代码门槛｜全程可视化｜无需手动配环境｜内置所有依赖｜多模型兼容下载地址：https://xiake.yun/ap…

2026/6/11 18:25:10 阅读更多

Windsurf IDE实测：AI原生开发如何重构编程逻辑？

Windsurf IDE实测：AI原生开发如何重构编程逻辑？如果我说，你过去十年积累的“搜索-复制-粘贴”编码习惯，正在成为一种低效甚至危险的负担，你会相信吗？最近，Anysphere推出的Windsurf IDE引发了开发…

2026/6/11 18:24:09 阅读更多

UVa 458 The Decoder

题目描述题目要求解码一个简单的字符替换密码。编码方式是对每个可打印 ASCII\texttt{ASCII}ASCII 字符进行统一的算术变换。从样例可以看出，编码字符与解码字符之间相差固定值（777）。例如，输入中的 1 对应输出中的 *&#xff08…

2026/6/11 18:24:09 阅读更多

LLM 多轮对话状态管理：从无状态 API 到有状态会话

LLM 多轮对话状态管理：从无状态 API 到有状态会话一、大模型 API 的无状态困境：上下文窗口的有限性与会话连续性大模型的 Chat API 本质上是无状态的——每次请求都需要发送完整的对话历史。这种设计简化了服务端实现，但给后端架构带来了两个…

2026/6/11 1:00:57 阅读更多

Spring Boot 3 与 GraalVM 原生镜像：从 JIT 到 AOT 的启动革命

Spring Boot 3 与 GraalVM 原生镜像：从 JIT 到 AOT 的启动革命一、JVM 冷启动的性能困境：云原生环境下的启动延迟 Java 应用在云原生环境中面临的核心挑战是冷启动延迟。一个典型的 Spring Boot 2 应用，启动时间约 3-8 秒，内存占…

2026/6/11 1:01:58 阅读更多

Go 错误处理与错误链：从哨兵错误到自定义错误类型的工程实践

Go 错误处理与错误链：从哨兵错误到自定义错误类型的工程实践一、Go 错误处理的工程困境：哨兵值与信息丢失 Go 的错误处理采用显式返回值模式，if err ! nil 是每个 Go 开发者最熟悉的代码片段。然而，当项目规模增长后，简…

2026/6/11 1:01:58 阅读更多

LED驱动技术全解析：从核心架构到实战选型与避坑指南

1. 从一颗灯珠到千亿市场：LED驱动的技术演进与商业逻辑十几年前，当我第一次从料盘上拿起一颗0603封装的白色LED时，它微弱的光晕和高达几块钱的单颗成本，让我很难想象今天它几乎照亮了我们生活的每一个角落。从手机屏幕的一抹背光&…

2026/6/11 0:58:15 阅读更多

索引堆及其优化

索引堆及其优化引言索引堆是一种数据结构，广泛应用于计算机科学和软件工程领域。它主要用于解决优先队列问题，如最小堆和最大堆。本文将详细介绍索引堆的概念、实现方法以及优化策略。索引堆的定义索引堆是一种基于堆数据结构的索引机制。它通过维护一个堆来存储数据…

2026/6/11 0:58:13 阅读更多

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

更多请点击： https://intelliparadigm.com 第一章：CSDN AI 数字营销的官方引流卡片是什么功能？ CSDN AI 数字营销平台推出的「官方引流卡片」，是一种面向技术创作者的轻量级、可嵌入式内容分发组件，专为提升博文、教程…

2026/6/11 0:58:10 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/11 9:57:14 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/11 9:57:16 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…