小白也能掌握!LangChain入门指南:开发你的第一个AI Agent(收藏学习) 本文详细介绍了如何使用LangChain框架开发AI Agent。核心内容围绕模型调用、工具封装和会话记忆保存三大核心进行展开从基础模型调用方法到工具定义再到智能体的创建和记忆模块的应用逐步引导读者构建一个能跑起来的AI Agent。LangChain提供了丰富的工具和便捷的接口即使是小白也能快速上手实现自主决策的智能体开发。26年一定是一个 Agent 大年我这边持续出系列文章帮助大家更好的落地 Agent今天的重点是程序员最常用的 Agent 框架 LangChain。只不过这东西可能由于 AI Coding 的成熟由给人看变成给 AI 看的。LangChain 既是一个开源的AI应用开发框架也是其背后同名公司LangChain的统称。该公司围绕AI应用开发构建了一套完整的产品矩阵包括广受欢迎的开源框架LangChain、用于构建复杂状态机的LangGraph以及企业级调试与监控平台LangSmith等。其中LangChain和LangGraph是社区中最活跃的两个开源项目。需要特别说明的是在LangChain 1.0版本之后这两个框架的定位发生了重要变化LangGraph 成为底层的智能体编排引擎专注于有状态、多轮、高度定制化的智能体流程控制而LangChain 则在此基础上演变为上层应用开发框架提供了更高阶的抽象、丰富的工具集成和便捷的智能体构建能力。简单来说LangChain 封装了 LangGraph 的复杂性让开发者能够快速搭建标准智能体而LangGraph 则为需要深度控制流程、自定义逻辑的场景提供了灵活的图式编程能力。对于大多数智能体应用比如本文将要构建的旅行智能助手LangChain 已足够胜任它简洁的API和开箱即用的组件能让我们更专注于业务逻辑本身注意1本文中的langchain 的版本1.0注意2案例很简单但一定要和前几篇文章对照阅读才知道Agent是什么才知道LangChain的意义如何开发一个AgentPS有些老板不喜欢用Agent喜欢用智能体所以我尽量讲究老板们。在上文中我们说了开发智能体的核心其实就三件事模型 工具 记忆。模型负责核心的推理决策工具用来落地执行具体的业务操作记忆则负责留存历史对话给模型的推理提供足够的上下文支撑。如果有同学还没搞懂什么是 AI Agent或者不知道该怎么设计、开发一个 AI Agent接下来咱们就实操起来 看看怎么用 LangChain 实现模型调用、工具封装、会话记忆保存这些基础功能最终完整开发出一个能跑起来的 AI Agent。模型调用lagnchain 提供了很多标准的方法来调用各个厂商的模型官网给出了完成整的集成列表https://docs.langchain.com/oss/python/integrations/providers/overview可以进入官网。查看支持的模型厂商具体是如何使用。这里我们用deepseek举例这个是langchain 支持deepseek模型的集成包可以直接使用from langchain_deepseekimportChatDeepSeek modelChatDeepSeek(model...,temperature0,max_tokensNone,timeoutNone,max_retries2,api_keyos.getenv(DEEPSEEK_API_KEY),# other params...)其他模型提供商也有对应的集成包大家可以自行去官网寻找也可以使用 openAI的标准格式基本上所有模型都支持这种方式modelChatOpenAI(modeldeepseek-chat,api_keyos.getenv(DEEPSEEK_API_KEY),base_urlhttps://api.deepseek.com,temperature0.7通过上面的方法我们就能得到一个模型实例 model接下来就可以调用这个 model 实例使用invoke或者stream方法向模型发起请求并获取它的返回结果了modelChatOpenAI(modeldeepseek-chat,api_keyos.getenv(DEEPSEEK_API_KEY),base_urlhttps://api.deepseek.com,temperature0.7)messages[{role:system,content:你是一个有用的助手。},{role:user,content:你是谁}]resultmodel.invoke(messages)print(result.content)# 流失输出resultmodel.stream(messages)forchunkinresult: print(chunk.content)声明工具在 LangChain 里定义工具函数特别简单用 tool 装饰器就能快速搞定 这也是最常用、最便捷的方式# 定义工具函数tool def get_weather(destination,date):# 实际调用天气 APIreturnf{destination} {date} 天气晴朗tool def get_attractions(destination):returnf{destination} 的热门景点有故宫、颐和园...# ... 其他函数模型调用工具的关键是靠工具名称和描述来判断该不该用这个工具。如果只是写个普通函数给 LangChain 用它会默认把函数名当工具名、函数的文档字符串当描述。但这种默认写法往往描述得不够精准模型很可能理解错工具用途导致调用出错。所以想让模型“精准识别、正确调用”工具最好的方式是显式定义给工具指定清晰的名称、详细的描述还要给每个参数也加上说明。推荐的做法就是用 tool 装饰器搭配 Annotated 和 Field 来补充这些详细的元数据让模型完全明白工具的作用和用法from langchain_core.toolsimporttool from typingimportAnnotated from pydanticimportField tool(name_or_callableget_weather,description获取指定城市指定日期的天气信息)def get_weather(destination: Annotated[str, Field(description城市名称如西安)], date: Annotated[str, Field(description日期格式 YYYY-MM-DD如2025-05-20)])-str:returnf{destination} {date} 天气晴朗tool(name_or_callableget_attractions,description获取指定城市的景点推荐)def get_attractions(destination: Annotated[str, Field(description城市名称如北京)])-str:# 实际开发中这里应调用景点 APIreturnf{city} 的热门景点有故宫、颐和园、天坛。定义智能体在 LangChain 中开发一个智能体非常简单。框架提供了标准方法 create_agent所有智能体都可以通过该方法快速定义。我们只需要传入几个核心参数即可完成一个智能体的创建**模型**通过 LangChain 的模型调用接口得到的大模型实例。**工具**声明好的工具列表。下面是一个完整的示例演示如何创建一个最简单的智能体并使用它from langchain_openaiimportChatOpenAI from langchain.agentsimportcreate_react_agent from langchain_core.toolsimporttoolimportos# 定义工具假设已有 get_weather, get_attractions# 示例工具函数已在前文定义此处略# 初始化模型modelChatOpenAI(modeldeepseek-chat,api_keyos.getenv(DEEPSEEK_API_KEY),base_urlhttps://api.deepseek.com,temperature0.7)# 工具列表tools[get_weather, get_attractions]# 创建智能体agentcreate_agent(modelmodel,toolstools)# 准备输入消息messages{messages:[{role:system,content:你是一个有用的助手。},{role:user,content:我想去北京玩能帮我看看天气和景点吗}]}# 调用智能体resultagent.invoke(messages)# 输出最终答案print(result[messages][-1].content)这样我们就完成了一个最简单的智能体。LangChain 的 create_agent 方法默认采用 ReAct 模式Reasoning Acting运行智能体其工作流程如下模型接收用户消息进行推理判断是否需要调用工具。如果需要工具模型输出工具调用指令框架自动执行对应工具并将结果作为新的消息添加到对话中。更新后的消息再次输入给模型重复上述步骤直到模型认为信息收集完毕给出最终答案。整个流程完全由框架自动管理开发者只需提供模型和工具即可获得一个具备自主决策能力的智能体。添加记忆上一节我们构建了一个能够调用工具的智能体它目前还没有记忆能力每次对话都是独立的无法记住之前的对话历史。为了让智能体具备多轮对话的能力LangChain 提供了完善的记忆Memory模块记忆分为两类短期记忆和长期记忆接下来我们一起使用langchain提供的方法来实现他们**短期记忆**通常指模型上下文窗口内的对话历史。由于大模型的上下文窗口有限我们无法将无限长的对话历史全部发送给模型。因此短期记忆通常采用“滑动窗口”或“摘要总结”的方式只保留最近的几轮对话或关键信息。在 LangChain中短期记忆的持久化是通过 Checkpointer 机制实现的。Checkpointer 机制在构建智能体时我们通常希望它能够记住之前的对话内容。LangGraph 通过 checkpointer 来保存每一轮交互后的状态StateCheckpointer:负责在每一步Step结束后将当前的状态包括消息历史、变量等保存起来。thread_id:当我们需要继续之前的对话时只需要提供相同的 thread_idCheckpointer 就会加载之前的状态从而实现“记忆”功能。InMemorySaver 是一个基于内存的检查点保存器原理它将状态数据保存在 Python 的字典内存中。特点速度快无需额外依赖如数据库。局限性程序重启后数据会丢失。因此仅适用于开发调试或不需要持久化的场景。生产环境替代方案在生产环境中通常会使用 PostgresSaver (基于 PostgreSQL) 或 SqliteSaver 等持久化方案以确保服务重启后记忆不丢失。from langgraph.checkpoint.memoryimportInMemorySaver# ...agentcreate_agent(# ...checkpointerInMemorySaver())# 调用时指定 thread_idconfig{configurable:{thread_id:1}}resultagent.invoke(inputmessages,configconfig)**长期记忆**为了解决上下文窗口的限制我们需要将历史对话持久化存储如数据库、向量库。在需要时通过检索算法如语义相似度搜索找到与当前问题最相关的历史记录注入到 Prompt 中。这也就是 RAG检索增强生成在记忆模块中的应用。下面我们以一个基于向量数据库的长期记忆实现为例向量化存储实现我们使用 Chroma 作为向量数据库配合 DashScope 的 Embedding 模型来实现记忆的存储与检索。首先我们需要初始化 Embedding 模型和向量数据库importos from langchain_community.embeddingsimportDashScopeEmbeddings from langchain_chromaimportChroma from langchain_core.documentsimportDocument# 初始化向量模型embeddingsDashScopeEmbeddings(modeltext-embedding-v4,dashscope_api_keyos.getenv(DASHSCOPE_API_KEY))# 初始化向量存储# persist_directory 指定数据持久化目录vectorstoreChroma(embedding_functionembeddings,persist_directory./chroma_db,collection_namechat_history)保存记忆当对话发生时我们需要将用户的输入和 AI 的回复保存下来。为了区分不同用户和会话我们在 metadata 中记录 user_id 和 session_iddef save_messages(messages: str, user_id: int, session_id: int): 保存用户输入和AI输出的会话记录# 将对话内容封装为 Document 对象并添加元数据docDocument(page_contentmessages,metadata{user_id:user_id,session_id:session_id})# 添加到向量数据库vectorstore.add_documents([doc])检索记忆在进行新一轮对话前我们可以根据用户的输入Query在向量库中检索相关的历史记录作为上下文提供给模型。这里我们还支持根据 user_id 和 session_id 进行过滤确保只检索当前用户或会话的记忆def load_messages(query: str, user_id: int, session_id: int): 加载用户输入和AI输出的会话记录# 构建过滤条件filters[]ifuser_id: filters.append({user_id:user_id})ifsession_id: filters.append({session_id:session_id})iflen(filters)1: filter_dict{$and:filters}eliflen(filters)1: filter_dictfilters[0]else: filter_dictNone# 执行相似度搜索返回最相关的 top-k 记录iffilter_dict: docsvectorstore.similarity_search(queryquery,k3,filterfilter_dict)else: docsvectorstore.similarity_search(queryquery,k3)returndocs这里就做好了长期记忆的保存和检索接下来让我们在智能体中增加消息的保存和检索。在短期记忆中可以在create_agent中 加入一个 checkpointerInMemorySaver()就可以实现短期记忆langchain就会将历史对话消息添加到提示词中那么我们如何把长期记忆添加到提示词中呢这里就不得不提到langchain的中间件Middleware了通过middleware添加长期记忆Middleware 提供了强大的生命周期钩子允许我们在模型调用前后、工具执行前后进行深度干预。中间件生命周期钩子我们需要自己定义一个中间件 add_long_memory 使用wrap_model_call在模型调用前 通过 load_messages 方法 查询 长期记忆 并将消息追加到messages中wrap_model_call def add_long_memory(request: ModelRequest, handler: Callable[[ModelRequest], ModelResponse])-ModelResponse: print(fModel call: {request})messagerequest.messages[-1]ifmessage.typehuman:embedding_docsload_messages(message.content, config[configurable][user_id], config[configurable][session_id])embedding_message\n.join([doc.page_contentfordocinembedding_docs])request.messages.append(ChatMessage(contentembedding_message,rolesystem))returnhandler(request)现在我们可以给agent添加长期记忆了只需要在create_agent中 添加一个参数middleware[add_long_memory()]Agent就会在调用模型前 调用add_long_memory 方法 将load_messages 查询到的历史消息添加到提示词中。完整的智能体代码如下config: RunnableConfig{configurable:{thread_id:1,user_id:1,session_id:1}}llmChatOpenAI(modeldeepseek-chat,api_keyos.getenv(DEEPSEEK_API_KEY),base_urlhttps://api.deepseek.com,temperature0.7)messages{messages:[{role:system,content:你是一个旅游规划助手。},{role:user,content:user_message}]}tools[get_weather, get_attractions]agentcreate_agent(llm,toolstools,middleware[add_long_memory()],checkpointerInMemorySaver())resultagent.invoke(inputmessages,configconfig)ai_messageresult[messages][-1].content save_messages(messagesuser_message ai_message,user_idconfig[configurable][user_id],session_idconfig[configurable][session_id])运行效果如下结语好了聊了这么多我们快速来回顾一下。用 LangChain 做一个智能体其实依旧是围绕三个核心模型、工具、记忆。模型不管你想用 DeepSeek 还是 OpenAILangChain 都给你封装好了一行代码换模型不用操心各家 API 的差异。工具把你要做的事写成函数加个 tool 装饰器再写清楚它是干什么的、参数是什么模型就能看懂、会调用。整个过程你会发现其实挺简单的。记忆分两类。短期记忆用 checkpointer设个 thread_id 就能让智能体记住刚才的对话长期记忆稍微费点功夫得借助向量数据库存历史再在模型调用前把相关的旧聊天翻出来塞给它。我们中间件那里演示的就是这个思路。把这些一组合一个能自己琢磨、会查天气、能聊天的旅行助手就搭起来了。而且 LangChain 这套设计还挺贴心的你要是想快速实现功能就用它的高层封装要是想精细控制每一步底下还有 LangGraph 和中间件让你折腾。最后想说LangChain 确实把智能体开发的门槛拉低了不少。不管是做个简单的问答还是想玩复杂的工作流你都可以从今天聊的这几个组件开始慢慢往上添东西。有空的话不妨自己动手搭一个试试代码跑起来的后还是挺有成就感的。只不过我们团队做 Agent 应该是不会使用 LangChain 的…最后2026年技术圈的分化愈发明显降薪裁员潮持续蔓延传统开发、测试等岗位大批缩水不少从业者陷入职业焦虑与之形成鲜明对比的是AI大模型相关岗位迎来疯狂扩招薪资逆势飙升150%大厂更是直接开出70-100W年薪疯抢具备实战能力的大模型人才甚至放宽年龄限制只求能快速落地技术、创造价值很多程序员、职场新人纷纷入局大模型领域绝非盲目跟风而是实实在在看到了不可替代的价值优势这也是2026年最值得抓住的职业风口1、窗口期红利入门门槛友好不同于成熟赛道的“内卷式招聘”2026年大模型人才缺口巨大简历只要达标掌握基础AI应用具备简单项目经验年龄、学历均非硬性要求小白可快速入门转行程序员也能无缝衔接2、技术可复用上手速度翻倍如果你有前后端开发、测试、数据分析等基础在大模型落地、系统部署、Prompt工程等环节会更具优势无需从零开始复用原有技术能力就能快速进阶3、懂业务更吃香竞争力翻倍单纯懂技术已不够2026年大厂更看重“技术业务”的复合型人才有垂直领域金融、医疗、工业等经验者能精准定位模型落地痛点薪资比纯技术岗高出30%以上更重要的是即便没有转型需求用AI大模型工具为工作赋能、提升效率也已经成为80%企业的硬性要求——不会用大模型提效未来很可能被行业淘汰那么2026年小白/程序员该如何高效学习大模型很多人想入门大模型却陷入两大困境要么到处搜集零散资料不成体系越学越懵要么被收费高昂的课程割韭菜花了钱却学不到实战技能白白浪费时间走弯路。今天就给大家精心整理了一份2026年最新、免费、系统化的AI大模型学习资源包覆盖从零基础入门到商业实战、从理论沉淀到面试通关的全流程所有资料均已整理归档无需拼凑直接领取就能上手学习小白可照做程序员可进阶扫码免费领取全部内容1、大模型系统化学习路线这份学习路线结合2026年行业趋势和新手学习规律由行业专家精心设计从零基础到精通每一步都有明确指引帮你节省80%的无效学习时间少走弯路、高效进阶避免踩坑。2、从0到进阶大模型学习视频教程从入门到进阶这里都有跟着老师学习事半功倍。3、大模型学习书籍电子文档涵盖2026年最新技术要点包括基础入门、Transformer核心原理、Prompt工程、RAG实战、模型微调与部署等内容4、AI大模型最新行业报告报告包含腾讯、阿里、甲子光年等权威机构发布的核心内容还有2026年中文大模型基准测评报告、AI Agent行业研究报告等帮你站在行业前沿把握技术风口。5、大模型项目实战配套源码项目包含Deepseek R1、GPT项目、MCP项目、RAG实战等热门方向还有视频配套代码手把手教你从0到1完成项目开发既能练手提升技术又能丰富简历为求职和职业发展加分。6、2026大模型大厂面试真题2026年大模型面试已全面升级不再单纯考察基础原理而是转向侧重技术落地和业务结合的综合考察很多程序员和新手因为缺乏针对性准备明明技术不错却在面试中失利。适用人群四阶段学习规划共90天可落地执行第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。到此为止大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器 损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…扫码免费领取全部内容7、这些资料真的有用吗这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】