01_LangChain是什么_带你理解LLM应用框架

发布时间：2026/6/15 0:22:17

概述为什么要使用LangChain很多人第一次接触大模型开发时写出来的代码大概是这样的fromopenaiimportOpenAI clientOpenAI()responseclient.chat.completions.create(modelgpt-4o-mini,messages[{role:user,content:帮我总结一下 LangChain 是什么}],)print(response.choices[0].message.content)这段代码没有问题。它能完成一次简单问答也能做翻译、总结、分类、改写。但只要需求稍微真实一点问题就来了用户问的问题依赖公司内部文档模型训练时并不知道。用户希望模型查询数据库、调用接口、读取文件而不是只生成一段文字。对话要支持多轮上下文不能每次都像第一次见面。业务里需要结构化输出例如稳定返回 JSON而不是一段自然语言。线上系统需要可观测、可调试、可回放而不是只看到最终答案。今天用 OpenAI明天可能要切到 Claude、Gemini、DeepSeek、本地 Ollama。裸调 LLM API 解决的是“让模型说话”LangChain 解决的是“让模型进入应用系统并完成任务”。LangChain 不是一个“更聪明的模型”它是一个 LLM 应用开发框架。它把模型、提示词、工具、检索、记忆、Agent 决策循环等能力抽象成可组合的模块帮助开发者把一次模型调用扩展成一个可维护、可调试、可演进的应用。核心价值LangChain 到底帮我们省了什么一、屏蔽不同模型供应商的差异不同模型供应商的 API 格式、参数命名、响应结构并不完全一致。裸调 API 时你的业务代码很容易和某个供应商绑定在一起。例如今天使用 OpenAI明天切换到 Anthropic 或本地 Ollama可能要改初始化方式、消息格式、流式输出处理、工具调用协议、错误处理逻辑。LangChain 的模型层提供了一套相对统一的接口。开发者可以通过init_chat_model或具体模型类接入不同供应商然后用类似的方式调用fromlangchain.chat_modelsimportinit_chat_model modelinit_chat_model(openai:gpt-4o-mini)responsemodel.invoke(用一句话解释 LangChain)print(response.text())当你需要切换模型时理想情况下业务逻辑不需要整体重写modelinit_chat_model(anthropic:claude-sonnet-4-5)# 或者modelinit_chat_model(ollama:llama3.1)模型当然不是完全等价的。不同模型在工具调用、上下文长度、结构化输出、多模态、推理能力上都有差异。LangChain 的价值不是抹掉这些差异而是把差异集中到模型适配层让业务链路尽量保持稳定。二、把提示词从字符串升级成工程化组件早期很多 LLM 应用的提示词都是这样拼出来的prompt你是一个客服助手请回答用户问题user_question这种写法一开始很快但很快会失控system 指令、用户输入、历史对话混在一起。变量越来越多字符串拼接容易出错。同一段提示词到处复制修改一次要改很多文件。很难做版本管理、复用和测试。LangChain 使用消息和 Prompt 模板来管理上下文。你可以清楚地区分系统指令、用户输入、AI 回复和工具结果fromlangchain_core.promptsimportChatPromptTemplate promptChatPromptTemplate.from_messages([(system,你是一个严谨的 LangChain 教程作者回答要准确、简洁。),(human,请解释这个概念{topic}),])messagesprompt.invoke({topic:Runnable})这样做的好处不是“代码更花哨”而是让 Prompt 变成可复用、可组合、可测试的工程资产。三、让模型连接外部数据大模型有两个天然限制它的上下文窗口有限不能一次吃下所有文档。它的训练知识有截止时间不知道你的私有数据和最新业务状态。这就是 RAGRetrieval-Augmented Generation检索增强生成出现的原因。一个典型 RAG 流程如下原始文档文档加载文本切分向量化 Embedding向量数据库用户问题检索相关片段拼接上下文LLM 生成答案LangChain 在这个流程中提供了多类基础组件Document Loader从 PDF、Markdown、网页、数据库、Notion、Slack 等来源加载文档。Text Splitter把长文档切分成适合检索和放入上下文的小块。Embedding Model把文本转成向量让语义相近的内容在向量空间中更接近。Vector Store存储和检索向量例如 Chroma、FAISS、Milvus、Pinecone 等。Retriever根据用户问题取回最相关的文档片段。RAG 让模型从“只靠训练记忆回答”变成“带着外部资料回答”。四、让模型调用工具而不是只输出文字很多业务问题不能靠“说”解决而要靠“做”解决。例如查天气。查订单状态。查询数据库。创建工单。调用搜索引擎。执行计算。写入 CRM 系统。LangChain 中的 Tool 本质上是一个有明确输入输出定义的函数。模型可以根据对话上下文决定是否调用工具以及传什么参数。fromlangchain.toolsimporttooltooldefquery_order(order_id:str)-str:根据订单号查询订单状态。returnf订单{order_id}当前状态已发货在 Agent 场景里模型看到用户问题后不一定直接回答而是可能先决定调用query_order拿到结果后再组织自然语言回复。这一步非常关键。因为它把 LLM 从“文本生成器”推向了“任务执行协调器”。对比裸调 API vs LangChain下面这张表可以快速看清两者的差异维度裸调 LLM API使用 LangChain模型接入直接调用某个供应商接口使用统一模型接口便于切换供应商Prompt 管理字符串拼接为主Prompt 模板、消息对象、变量注入外部数据需要自己写检索和拼接逻辑提供 Loader、Splitter、Retriever、Vector Store 等组件工具调用自己定义协议和解析逻辑使用 Tool / Agent 体系组织工具调用多轮记忆自己维护历史消息可结合 checkpointer、thread state、memory 策略管理上下文结构化输出常见做法是正则或手写解析可结合 schema、parser、response_format 等方式约束输出调试观测需要自己打日志可结合 LangSmith 做链路追踪和评估适合场景简单问答、一次性脚本RAG、Agent、生产级 LLM 应用这并不是说所有项目都必须使用 LangChain。如果你的需求只是“用户输入一句话模型返回一句话”裸调 API 更直接。但如果你要做知识库问答、智能客服、SQL 查询助手、代码审查 Agent、多工具协作系统LangChain 会明显降低工程复杂度。架构地图理解 LangChain 的几个核心模块可以把 LangChain 理解成围绕 LLM 应用的一组积木用户输入 | v Prompt / Messages ---- Model | | | v | Structured Output | v Runnable / LCEL 组织调用流程 | ---- Retrieval连接外部知识 | ---- Tools连接外部动作 | ---- Memory / Checkpointer保存对话状态 | v Agent模型工具提示词中间件决策循环下面逐个拆解。Models模型是推理引擎Models 是 LangChain 应用的核心推理层。它负责理解输入、生成输出、判断是否调用工具、是否返回结构化结果。在 LangChain 中模型既可以单独调用也可以放进 Agent 循环中responsemodel.invoke(解释一下 RAG)当你只是做分类、总结、改写、抽取时直接调用模型就够了。当你需要模型在多步任务中选择工具、读取上下文、根据中间结果继续决策时就会进入 Agent 场景。Prompts / Messages上下文的组织方式LLM 并不是只看一段字符串。现代聊天模型通常接收一组 messagesSystemMessage告诉模型角色、边界、规则和输出风格。HumanMessage用户输入。AIMessage模型历史回复也可能包含工具调用信息。ToolMessage工具执行结果用来回传给模型继续推理。理解 Messages 很重要因为 LangChain 的多轮对话、工具调用、Agent 状态最终都会落到“模型这次到底看到了哪些上下文”上。Runnable / LCEL把组件串成流程在 LangChain 里很多组件都实现了 Runnable 接口。你可以把 prompt、model、parser 等组件像管道一样组合chainprompt|model resultchain.invoke({topic:LangChain})这就是 LCELLangChain Expression Language的基本思想把一个复杂调用流程拆成多个可组合、可替换、可观测的步骤。后续学习 LangChainRunnable 是必须重点理解的抽象。因为不管是简单 chain还是复杂 Agent背后都离不开“输入经过多个步骤变成输出”的数据流。Retrieval让应用拥有自己的知识库Retrieval 负责从外部知识源中取回和用户问题相关的内容。典型场景包括企业内部文档问答。法律、医疗、金融等领域知识库。产品说明书问答。代码仓库理解。客服 FAQ 检索。注意RAG 不是简单地“把所有文档塞给模型”。正确做法通常是加载文档、切分、向量化、检索、重排、拼接上下文再让模型回答。Tools让模型能执行动作Tool 是连接模型和外部世界的桥。如果 Retrieval 解决的是“模型不知道什么”那么 Tool 解决的是“模型不能做什么”。例如模型本身不能真的查询你的订单系统。但你可以提供一个query_order工具让模型在需要时调用它。工具设计的关键不是函数写得多复杂而是输入输出要清晰描述要准确错误处理要可控。因为模型会根据工具名称、参数 schema 和描述来判断什么时候调用它。Memory让多轮任务有连续性一个没有记忆的聊天应用会很别扭用户第一轮说“我想订明天去上海的票。”第二轮问“那后天返回呢”如果系统不知道“上海”和“订票”来自上一轮就无法正确理解第二轮。在 LangChain 新版本中短期记忆通常和 agent state、thread、checkpointer 相关。你可以把一个 thread 理解成一段会话checkpointer 负责保存这个 thread 的状态使对话可以继续。但记忆不是越多越好。历史消息太长会增加成本、拖慢响应还可能让模型被过时信息干扰。因此真实应用里经常要做裁剪、摘要、长期记忆和短期记忆分层。Agents让模型进入“观察-决策-行动”循环Agent 是 LangChain 中最容易被误解的概念。它不是一个神秘的新模型而是一种运行方式模型在循环中根据当前上下文决定下一步做什么。一个简化的 Agent 循环如下否是用户任务模型思考是否需要工具?直接回答调用工具观察工具结果在 LangChain 里可以用create_agent快速创建一个 Agent。它通常由模型、工具、系统提示词、中间件、状态管理等部分组成。Agent Model Tools Prompt State Loop。适用场景什么时候该用 LangChain场景一知识库问答这是 LangChain 最典型的入门场景。比如你有一批 PDF、Markdown、Word 文档希望用户提问时系统能基于这些文档回答并给出引用来源。这类系统通常需要文档加载。文本切分。向量检索。结果重排。上下文拼接。答案生成。引用来源展示。LangChain 在这些环节都有现成抽象适合快速搭建原型也适合逐步演进成生产系统。场景二智能客服智能客服不是简单聊天。它通常需要识别用户意图。查询订单、物流、售后状态。检索 FAQ。记住当前会话上下文。对退款、改地址等敏感操作引入人工审批。这类需求天然适合 Agent Tools Memory RAG 的组合。场景三自然语言查数据库用户输入“帮我查一下上个月华东区销售额最高的 10 个客户。”系统需要理解意图、读取表结构、生成 SQL、校验 SQL、执行查询、解释结果。这不是一次模型调用能稳定完成的任务。你需要工具、结构化输出、安全校验和执行链路。场景四代码审查 Agent一个代码审查 Agent 可能需要读取 Git Diff。理解变更影响范围。调用静态扫描工具。调用安全扫描工具。生成 Markdown 审查报告。自动评论到 PR。这类任务有明显的多步骤、多工具、可追踪需求也适合 LangChain / LangGraph 体系。常见误区学 LangChain 前先避开这几个坑误区一以为 LangChain 会让模型本身变聪明LangChain 不会改变模型能力上限。如果模型本身数学能力弱、工具调用能力差、上下文理解差LangChain 不能魔法般解决。但 LangChain 可以帮你更好地组织上下文、接入工具、补充外部知识、追踪错误从工程上提高系统可靠性。误区二所有需求都上 AgentAgent 很强但也更复杂。如果任务路径固定例如“读取用户输入 - 调用模型 - 解析 JSON”用普通 chain 就够了。只有当任务需要模型动态决定下一步时Agent 才更有价值。误区三RAG 就是向量数据库向量数据库只是 RAG 的一部分。真正影响效果的还有文档解析、切分策略、embedding 模型、检索参数、重排、Prompt 组织、引用展示、评估集建设。误区四把历史对话无限塞进上下文上下文不是垃圾桶。历史越长成本越高延迟越高模型越容易被无关信息干扰。合理的记忆系统应该区分当前任务必须保留的信息。可以摘要压缩的信息。可以丢弃的过期信息。需要长期保存的用户偏好或业务事实。学习路线从这篇文章之后怎么继续建议按下面顺序学习先跑通一个最小 LangChain 程序理解model.invoke()和chain.invoke()。学模型层掌握init_chat_model和不同供应商切换。学 Prompt 模板和 Messages搞清楚模型到底看到了什么。学 LCEL / Runnable理解 LangChain 的组合方式。学 RAG把模型接入自己的文档。学 Tools 和 Agent让模型能调用外部能力。学 Memory、Middleware、LangGraph进入生产级 Agent 开发。最后读源码理解这些抽象是如何实现的。这个系列后续会按照这条路线展开从能跑到能用再到能读源码。总结LangChain 的本质是什么如果只记住一句话LangChain 是一个用于构建 LLM 应用的工程框架它把模型调用、提示词、工具、检索、记忆、Agent 循环和可观测能力组织成可组合的模块。再具体一点Models解决“调用哪个模型、如何统一调用”的问题。Prompts / Messages解决“给模型什么上下文”的问题。Runnable / LCEL解决“如何把多个步骤组合成流程”的问题。Retrieval解决“模型如何使用外部知识”的问题。Tools解决“模型如何执行外部动作”的问题。Memory / Checkpointer解决“多轮任务如何延续状态”的问题。Agents解决“模型如何在循环中自主决策下一步”的问题。LangChain 的价值不在于让一次调用更短而在于让复杂 LLM 应用更容易被组织、调试、扩展和上线。

MPC8260 UPM内存控制器：可编程时序与嵌入式存储接口设计详解

1. MPC8260内存控制器与UPM：嵌入式存储接口的“交响乐指挥”在嵌入式系统开发，尤其是通信处理器、工业控制这类对实时性和可靠性要求极高的领域，处理器与外部存储器的“对话”效率直接决定了整个系统的性能天花板。这就像一支交响乐团&#x…

2026/6/15 0:22:17 阅读更多

从SpeexDSP迁移到WebRTC 3A：我们团队踩过的坑和性能提升实测（附代码对比）

从SpeexDSP迁移到WebRTC 3A：我们团队踩过的坑和性能提升实测（附代码对比）当我们的语音社交产品日活突破百万时，用户对通话质量的投诉开始集中爆发——多人连麦时的回声啸叫、地铁环境下的噪声干扰、音量忽大忽小的体验&#xff0c…

2026/6/15 0:18:13 阅读更多

LangChain 实战指南：从调用模型到构建 AI 应用：一次项目复盘里的真实取舍

《LangChain 实战指南：从调用模型到构建 AI 应用》看起来是个大话题，但真落到项目里，常常就是几个具体选择。下面我尽量按实际开发时会遇到的问题来讲。摘要这篇面向具备 Python 基础、想上手 AI 应用开发的开发者，但不会把“Lang…

2026/6/15 0:15:11 阅读更多

软考嵌入式设计师必看：网络与安全这10个高频考点，别再死记硬背了！

软考嵌入式设计师高效突破：网络与安全10大核心考点实战解析备考软考嵌入式系统设计师的考生们，是否曾被网络与安全模块的庞杂知识点压得喘不过气？OSI七层模型、TCP/IP协议栈、加密算法……这些概念不仅抽象难记，考试中还常以组合形…

2026/6/15 1:47:13 阅读更多

Git新手避坑指南：为什么你的.idea文件夹总在‘捣乱’？彻底解决Untracked Files问题

Git新手避坑指南：为什么你的.idea文件夹总在‘捣乱’？彻底解决Untracked Files问题刚接触Git的开发者常会遇到这样的场景：当你准备切换分支时，系统突然弹出警告"Untracked Files Prevent Checkout"，而罪魁祸…

2026/6/15 1:45:12 阅读更多

Spring全家桶面试进阶宝典，普通程序员必备！

Spring框架自从诞生以来就一直备受开发者青睐，它涵盖了Spring、Springboot、SpringCloud等诸多解决方案，一般我们都会统称为Spring全家桶！出于Spring框架在Java开发者心中中的统治地位，所以不管是面试还是工作，Spring都…

2026/6/15 1:44:52 阅读更多

实战分享：用Hook open()这招，轻松绕过Android App对/data/local/tmp的变态检测

Android逆向工程实战：Hook系统调用绕过敏感目录检测在移动安全研究领域，逆向工程师常常需要面对各种反调试和检测机制。其中，对/data/local/tmp目录的检测已经成为许多安全应用的标准防御手段。本文将深入探讨一种高级绕过技术——通过Hook系…

2026/6/15 1:44:11 阅读更多

RWKV 批量推理中 Prefill 的正确打开方式

RWKV 批量推理中 Prefill 的正确打开方式项目地址：https://github.com/AUXStar/RWKV-Server 文章目录RWKV 批量推理中 Prefill 的正确打开方式一、引言二、Prefill vs Decode：计算特性对比实测吞吐数据三、Albatross v3a 的 Kernel 特化路径select_path…

2026/6/15 1:44:11 阅读更多

避坑指南：STM32F4上搭建NuttX系统时，那些你可能会遇到的交叉编译与环境配置问题

STM32F4移植NuttX实战：从环境配置到避坑指南第一次在STM32F4上移植NuttX的经历，就像在雷区里跳探戈——每一步都可能踩到意想不到的"惊喜"。作为一款轻量级实时操作系统，NuttX在嵌入式领域越来越受欢迎，但它的交叉编译环…

2026/6/15 1:43:10 阅读更多

终极便携开发套件：5分钟快速上手w64devkit Windows开发环境

终极便携开发套件：5分钟快速上手w64devkit Windows开发环境【免费下载链接】w64devkit Portable C and C Development Kit for x64 (and x86) Windows 项目地址: https://gitcode.com/gh_mirrors/w6/w64devkit 你是否厌倦了在Windows上配置复杂的C/C开发环境…

2026/6/15 0:00:36 阅读更多

深蓝词库转换：打破20+输入法壁垒的技术架构深度解析

深蓝词库转换：打破20输入法壁垒的技术架构深度解析【免费下载链接】imewlconverter ”深蓝词库转换“ 一款开源免费的输入法词库转换程序项目地址: https://gitcode.com/gh_mirrors/im/imewlconverter 当你在不同平台间切换输入法时，是否曾为无…

2026/6/15 0:02:18 阅读更多

NSK紧凑型精密滚珠丝杠技术手册

型号 W1202FA-3P-C3Z5 属于 the sources 中 NSK 推出的紧凑型 FA 系列（Compact FA Series）高速精密滚珠丝杠。如果您一路追踪了之前的查询记录，这款产品正是您不久前查询的 125 规格（12 mm 粗轴、5 mm 导程、预紧无背隙版&#x…

2026/6/15 0:02:59 阅读更多

音乐文件解锁实战指南：3个场景解决你的播放困境

音乐文件解锁实战指南：3个场景解决你的播放困境【免费下载链接】unlock-music 在浏览器中解锁加密的音乐文件。原仓库： 1. https://github.com/unlock-music/unlock-music ；2. https://git.unlock-music.dev/um/web 项目地址: https://git…

2026/6/15 0:09:30 阅读更多

从Landsat到高分系列：手把手教你选择适合自己项目的遥感卫星数据

遥感卫星数据选型实战指南：从参数解析到场景化应用当面对GEE、PIE-Engine等云平台上数十种遥感数据源时，许多研究者常陷入选择困难——Landsat的历史连续性、Sentinel-2的红边波段优势、高分系列的亚米级分辨率各有千秋。本文将打破常规参数罗列式对比&a…

2026/6/15 0:09:27 阅读更多

MC68302 AutoBaud技术：硬件级串口波特率自动检测原理与实现

1. 项目概述：MC68302 AutoBaud技术深度解析在嵌入式系统开发，尤其是那些需要与外部设备进行串口通信的场景里，最让人头疼的环节之一就是波特率匹配。想象一下，你设计了一个数据采集终端，需要连接来自不同厂家、不同年代…

2026/6/15 0:09:27 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/14 10:35:25 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/14 10:02:42 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…