本文详细介绍了5种主流的AI应用开发模式包括HTTP API直接调用、官方SDK调用、AI开发框架、低代码AI开发平台以及AI编程工具的SDK。每种模式都提供了实际代码示例帮助读者快速理解其使用方法和适用场景。无论你是想了解底层原理还是希望快速开发AI应用都能从中找到适合你的解决方案。此外文章还对比了各种模式的优劣并建议读者从HTTP API开始学习逐步掌握更高级的工具和技术。最近有个学员跟我说他去面试的时候面试官问了一个问题如果让你开发一个 AI 应用你会怎么做他自信满满地回答那还不简单调个 API 就行了呗。面试官追问就这一种方式你确定吗他直接懵了场面一度非常尴尬。其实这个问题很有代表性。很多同学对 AI 应用开发的认知还停留在「调 API」这个层面觉得能发个 HTTP 请求拿到 AI 的回答就完事儿了。但实际上调 API 只是最基础的一种方式。从最底层的 HTTP 请求到官方 SDK 封装到功能齐全的开发框架再到拖拽式的低代码平台还有一种鲜为人知的隐藏模式AI 应用开发的模式已经非常丰富了。今天就给大家一次性讲清楚目前主流的 5 种 AI 应用开发模式 到底是什么、怎么用、各自适合什么场景。每种模式我都会给一段简单的代码示例帮你快速理解。搞懂这些不仅面试的时候能应对自如用 AI 编程做项目的时候也能知道该往技术栈里加什么。一、HTTP API 直接调用最原始、最直接的方式就是通过 HTTP 请求调用大模型的 API 接口。简单来说就是你的程序给大模型发送一条消息大模型处理完之后把结果返回给你。这就像打电话给一个专家咨询问题。你得自己拨号码拼接 API 地址、报上身份传入密钥、把问题描述清楚构造请求体然后等专家回答完再自己记录下来解析响应。虽然每一步都得自己来但你对整个过程有完全的掌控。不管你用什么编程语言只要能发 HTTP 请求就能调用 AI 大模型。所以这是所有大模型服务商都支持的最基本的调用方式。无论是国外的 OpenAI 和 Anthropic、国内的 DeepSeek 和通义千问还是本地用 Ollama 部署的开源模型甚至是 OpenRouter 这类一个 API Key 就能调用多家模型的聚合平台都支持通过 HTTP API 来调用。目前 HTTP API 调用主要有两种协议格式。1OpenAI 兼容格式这套格式最初是 OpenAI 定义的但因为用的人多现在已经成了各家默认遵循的标准。DeepSeek、通义千问、Kimi、Ollama 等绝大多数大模型服务商都兼容这套格式。有统一标准的好处是你写一套调用大模型的代码只需要换个 API 地址和密钥就能无缝切换到不同厂商的模型不用重新适配格式。举个例子用 HTTP 请求工具 curl发一个 OpenAI 兼容格式的请求调用 DeepSeek 大模型curl https://api.deepseek.com/chat/completions / -H Authorization: Bearer 你的API密钥 / -H Content-Type: application/json / -d { model: deepseek-v4-pro, messages: [ {role: system, content: 你是一个有用的助手}, {role: user, content: 用一句话介绍什么是AI应用开发} ] }如果换成调用 OpenAI 的模型只需要把 URL 请求地址和 model 模型名称换一下就行请求格式完全一样。2Anthropic Messages API 格式AnthropicClaude 模型的开发商用的是自己独立的一套协议请求结构和 OpenAI 不太一样。比如系统提示词是放在顶层的system参数里而不是作为一条消息传入。如果你要调用 Claude 系列模型就得按它的格式来。curl https://api.anthropic.com/v1/messages / -H x-api-key: 你的API密钥 / -H content-type: application/json / -d { model: claude-sonnet-4-6, max_tokens: 1024, system: 你是一个有用的助手, messages: [ {role: user, content: 用一句话介绍什么是AI应用开发} ] }实际开发 AI 应用的时候你还需要了解请求和响应中各个字段的含义。最核心的是messages字段也就是你跟 AI 的对话消息列表此外还有temperature控制回答的随机性、max_tokens限制回答长度、响应里的usage字段能告诉你这次调用消耗了多少 Token 等等。各家平台一般都会提供详细的 API 文档照着文档来就行。大模型的 API 一般会提供两种调用方式。一种是普通请求一问一答等 AI 生成完整个回答后一次性返回。另一种是流式请求如果你想实现一个字一个字往外蹦的打字机效果就需要用到 SSEServer-Sent Events 流式传输协议让服务端把生成的内容一段一段地推送给你。用法也不复杂一般只需要在请求参数里把stream设置为 true 就行了。下面用 Python 写一个流式调用的例子感受一下打字机效果是怎么实现的import requests response requests.post( https://api.deepseek.com/chat/completions, headers{ Authorization: Bearer 你的API密钥, Content-Type: application/json }, json{ model: deepseek-chat, stream: True, # 开启流式输出 messages: [ {role: system, content: 你是一个有用的助手}, {role: user, content: 用一句话介绍什么是AI应用开发} ] }, streamTrue# 开启流式接收 ) # 逐行读取服务端推送的内容 for line in response.iter_lines(): if line: print(line.decode())二、官方 SDK 调用写过上面那段代码的同学应该能感受到直接用 HTTP 调用还是挺麻烦的。填写 URL、设置请求头、构造 JSON、解析响应、处理错误码、流式数据逐行解析…… 这些跟你的业务逻辑压根儿没关系但每一个都得自己处理。所以各大模型厂商都提供了 SDKSoftware Development Kit 软件开发工具包帮你把这些底层细节封装好了。如果 HTTP API 是自己拨号打电话那 SDK 就像装了一个智能通讯 APP。你只管说话APP 帮你自动拨号、接通、录音、整理成文字你拿到手的直接就是现成的答案。目前 OpenAI、Anthropic、Google、阿里云百炼、智谱等主流大模型服务商都提供了多语言的 SDK覆盖 Python、Java 等常用语言。SDK 的本质就是对 HTTP 请求的封装所以前面提到的 OpenAI 兼容格式在 SDK 层面同样适用。比如 DeepSeek 兼容 OpenAI 的协议那你直接用 OpenAI 的 SDK改个参数就能调用 DeepSeek 模型了。比如用 OpenAI 的 Python SDK 来调用 GPT 模型代码如下# 引入 OpenAI 官方 SDK from openai import OpenAI client OpenAI(api_key你的API密钥) completion client.chat.completions.create( modelgpt-5, messages[ {role: system, content: 你是一个有用的助手}, {role: user, content: 用一句话介绍什么是AI应用开发} ] ) print(completion.choices[0].message.content)不用填写 URL、不用设置请求头、不用手动解析 JSON几行代码就搞定了。而且 SDK 还内置了错误重试、类型提示、流式处理等功能让开发效率更高、代码更简洁、系统也更稳定。如果你用的是 DeepSeek 模型代码几乎一模一样只需要改一下 base_url 请求地址和 model 模型名称就行client OpenAI( api_key你的DeepSeek密钥, base_urlhttps://api.deepseek.com ) # 调用时把 model 换成 DeepSeek 的模型名 completion client.chat.completions.create( modeldeepseek-chat, messages[...] )三、AI 开发框架SDK 解决了 怎么方便地调模型 的问题但企业中的 AI 应用远不止调一下模型那么简单。你可能还需要让 AI 记住之前聊过什么会话记忆、让 AI 先去知识库里查资料再回答RAG 检索增强生成、让 AI 能调用外部工具比如查天气、搜网页工具调用、通过 MCP 协议接入更多外部服务、甚至让多个 AI 协同工作完成复杂任务……这些能力如果每个都自己从零开始写工作量巨大。所以就有人在 SDK 的基础上又封装了一层做成了 AI 开发框架。打个比方SDK 相当于给你提供了发动机、轮胎、方向盘这些零件你得自己一个一个装配AI 开发框架相当于直接给你一辆半成品车底盘、车架、电路都搭好了你只需要决定外观和内饰就能上路。下面以 Python 和 Java 为例列举几个主流的 AI 开发框架之后你在 AI 编程时看到这些技术名词就不会感到陌生了。Python 生态中LangChain 是目前最主流的 AI 应用开发框架提供了大量集成组件涵盖模型调用、RAG 知识库、工具调用、MCP 集成等常用能力。LangGraph 是 LangChain 团队推出的进阶框架用图的结构来编排复杂的 AI 工作流适合构建有状态的、需要循环和分支逻辑的 AI 智能体。举个例子用 LangChain 调用模型的代码长这样from langchain.chat_models import init_chat_model from langchain.messages import HumanMessage, SystemMessage model init_chat_model(gpt-5) messages [ SystemMessage(你是一个有用的助手), HumanMessage(用一句话介绍什么是AI应用开发) ] response model.invoke(messages) print(response.content)看起来和 SDK 差不多对吧但 LangChain 的价值在于当你需要加上记忆、工具调用这些高级能力时只需要几行配置就能搞定不用自己从零实现。比如创建一个带工具调用能力的 AI Agentfrom langchain.agents import create_agent from langchain.tools import tool # 定义一个工具让 AI 能查天气 tool def get_weather(city: str) - str: 查询指定城市的天气 return f{city}今天晴25°C # 一行代码创建带工具调用能力的 Agent agent create_agent(modelgpt-4o, tools[get_weather]) # 调用 Agent它会自动判断是否需要调用工具 result agent.invoke( {messages: [{role: user, content: 北京今天天气怎么样}]} )这样 AI 就能主动调用工具去查天气了你只需要定义好工具函数LangChain 帮你搞定剩下的。而且很多其他语言生态的 AI 开发框架在设计上几乎都参考了 LangChain 的思路比如 Java 的 LangChain4j、Go 的 LangChainGo功能上和 Python 版基本对齐学会一个版本切到其他语言也很容易上手。Java 生态还有 Spring 官方推出的 Spring AI 以及阿里的 Spring AI Alibaba深度融入 Spring Boot 生态适合 Java 后端开发者快速上手。另外 Vercel AI SDK 也值得大家关注它是 TypeScript 生态的 AI 开发框架提供了 20 多个模型供应商的统一接口特别适合前端和全栈开发者。四、低代码 AI 开发平台框架虽然功能强大但写代码终归是有门槛的。特别是业务人员或者不太会编程的同学光是搭个开发环境就够头疼的了。这时 低代码 AI 开发平台 就派上用场了不用写代码也能搭出 AI 应用。打个比方低代码平台就像搭积木。大模型是一块积木知识库是一块积木工具调用是一块积木每块积木都是现成的你只需要决定怎么拼接、拼成什么形状就好了。Dify 是典型的低代码 AI 开发平台它支持通过可视化界面搭建 AI 聊天助手、工作流、知识库问答等应用还能一键接入各种大模型。它最大的优势是开源、可私有化部署企业想把数据放在自己服务器上也没问题。在 Dify 上搭一个 AI 聊天助手大概就这么几步选择一个大模型比如 GPT-5.5 或 DeepSeek写一段系统提示词告诉 AI 它的角色配置知识库可选上传你的文档资料点击发布就能得到一个可调用的 API 或者直接分享的聊天链接整个过程不需要写一行代码。类似的平台还有不少比如字节跳动的 Coze扣子也支持可视化搭建 AI 应用容易上手阿里云百炼是一站式的大模型应用构建平台集成了模型调用、智能体编排、知识库管理等能力还有开源的工作流自动化平台 n8n擅长做跨系统的 AI 自动化流程。五、AI 编程工具的 SDK前面 4 种模式覆盖了从手动写代码、到完全不写代码的各种方案。但还有一种很多同学不知道的模式。。。2026 年Cursor、Claude Code、GitHub Copilot 等 AI 编程工具纷纷推出了自己的 SDK。你可以在自己的代码里直接调用这些 AI 编程工具的 Agent它们能帮你读代码、改代码、跑命令而且你在 AI 编程工具里配置好的 MCP 服务、Skills、项目规则这些能力通过 SDK 调用时同样能生效。如果说前面那些方式都是你自己动手干活那么使用 AI 编程工具的 SDK 相当于你雇了一个会写代码的 AI 程序员。你只需要告诉它做什么它会自动读文件、分析代码、完成开发。以 Cursor SDK 为例允许你在 TypeScript / Node.js 代码中直接调用 Cursor 的 AI Agent。先新建项目文件夹然后打开终端在该目录下输入一行命令安装 SDKnpm install cursor/sdk然后登录 Cursor Dashboard在 Integrations 页面生成一个 API Key 并保存下来后面代码里需要用它来验证身份。假设本地有一个「创作选题获取器」项目里面用 AGENTS.md 定义了选题获取的工作流规则还安装了 frontend-design 前端设计技能。现在想让 AI 帮我获取今天的热门选题并生成一个漂亮的网页报告。新建一个 JavaScript 文件比如main.js写入以下代码import { Agent } from cursor/sdk; // 创建 AI Agent指向「创作选题获取器」项目 const agent await Agent.create({ apiKey: 你的 API Key, model: { id: gpt-5.5 }, local: { cwd: /Users/yupi/workflow/创作选题获取器 }, }); // 一句话下达指令 const run await agent.send(帮我获取今日 AI 领域的热门选题并生成一个网页报告); // 收集所有事件打印到终端的同时保存到文件 const events []; for await (const event of run.stream()) { console.log(event); events.push(event); } // 把完整的事件记录保存为 JSON 文件方便事后分析 const fs awaitimport(fs); fs.writeFileSync(agent-output.json, JSON.stringify(events, null, 2));然后在终端执行node main.js运行后你会在终端看到一连串事件输出比如 Agent 开始执行。从日志里可以清晰地看到 Agent 的整个执行过程它先用glob工具扫描了项目目录然后用read工具依次读取了 AGENTS.md 工作流规则和 frontend-design 的 SKILL.md 技能说明接着通过shell工具调用了项目里的热点获取脚本进行联网搜索从 GitHub、Hacker News 等 6 个平台采集了 70 条热门话题再通过edit命令生成了一个近千行代码的 HTML 网页报告。最后 Agent 还自动打开了浏览器让你直接查看生成的选题报告。你会发现整个过程和在 Cursor 编辑器里跟 AI 对话一模一样。但区别在于现在你是用代码来调用它的这意味着你可以把它嵌入到 CI/CD 流水线、自动化脚本、甚至自己的产品里。普通的大模型 SDK 只能帮你生成文本而 AI 编程工具的 SDK 能帮你直接操作代码库、调用工具、生成文件。如果只是一次性的简单任务还有更简洁的写法const result await Agent.prompt( 给这个项目写一个 README.md, { apiKey: process.env.CURSOR_API_KEY!, model: { id: composer-2 }, local: { cwd: process.cwd() }, } );前面演示的是本地运行模式Agent 直接在你自己的电脑上跑适合开发调试。除此之外Cursor SDK 还支持 Cursor 托管云模式Cursor 帮你在云端开一台隔离的虚拟机来执行任务适合同时跑多个 Agent 并行处理以及自托管云模式你自己管理服务器适合企业内部使用。有了 AI 编程工具的 SDK 后你甚至可以把 AI 编程工具当成一种开发环境就像部署项目需要配置数据库一样在服务器上配好 AI 编程工具的环境然后在代码中通过 SDK 来调用实现自动化的代码生成、审查、重构等任务。除了 CursorAnthropic 的 Claude Agent SDK 和 GitHub 的 Copilot SDK 也提供了类似的能力用法大同小异。怎么选择讲完了 5 种 AI 应用开发模式那实际开发的时候到底该选哪种呢这里我帮大家做了一个简单的对比模式一句话总结适合谁HTTP API自己拼请求调模型最底层最灵活想了解底层原理、或 SDK 不支持的语言官方 SDK用官方封装好的工具包调模型大多数开发者的日常开发AI 开发框架记忆、RAG、工具调用等能力开箱即用需要开发完整 AI 应用的团队低代码平台拖拽搭建不用写代码非技术人员、快速验证想法AI 编程工具 SDK让 AI Agent 帮你写代码想把 AI 编程能力集成到自动化流程中注意这 5 种模式之间并不是互相排斥的实际开发中经常会混着用。比如用低代码平台快速搭个原型验证想法验证通过后再用开发框架重写成正式版本或者在框架搭好的项目里某些模块直接用 HTTP API 调一个特殊接口。选择的核心原则是用最少的成本解决当前的问题。 能拖拽解决的就别写代码能用框架搞定的就别自己造轮子能用 SDK 的就别手撸 HTTP。不过如果你是在学习阶段我建议反过来从 HTTP API 开始一步步往上走。这样对每一层的原理都能有清晰的理解后面用更高层的工具也不会一头雾水。最后哔哔AI 应用开发这个领域变化太快了新框架、新工具几乎每个月都在冒出来。但万变不离其宗底层就是这几种模式。搞懂了这些不管未来出什么新工具你都能快速定位它属于哪一层、解决什么问题。回到开头那个面试场景如果你能把这 5 种模式的适用场景和优劣讲清楚面试官大概率会对你刮目相看。最后如果说程序员已经是高薪职业那么干AI的程序员就是高薪中的高薪。现在的市场已经用数据给程序员指明了方向学AI大模型就是冲刺高薪的最优解看着身边越来越多的同行转型大模型、拿到高薪offer很多人心里都动了心但真正的难题来了零基础小白不知道从哪入门有基础的程序员找不到系统学习路径实战项目练手无门面试不知道考什么别慌今天就给大家整理了一份【2026年最新版】AI大模型免费学习资源包覆盖从入门到实战、从理论到面试、从基础到进阶的全流程所有资料均已整理归档无冗余、无套路免费分享给每一位想抓住AI风口的程序员和小白扫码免费领取全部内容1、大模型系统化学习路线2、大模型学习书籍文档3、AI大模型最新行业报告4、大模型项目实战配套源码5、大模型大厂面试真题四阶段精细化学习规划附时间节点可直接照做结合上述资源给大家整理了一份可直接落地的四阶段学习规划总时长约2个月小白可循序渐进程序员可根据自身基础调整节奏高效掌握大模型核心能力快速实现从“入门”到“能落地、能面试”的跨越。第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。到此为止大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器 损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…扫码免费领取全部内容6、这些资料真的有用吗这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
小白程序员必备:5种主流AI应用开发模式,轻松掌握大模型开发,收藏学习!
发布时间:2026/6/12 15:25:10
本文详细介绍了5种主流的AI应用开发模式包括HTTP API直接调用、官方SDK调用、AI开发框架、低代码AI开发平台以及AI编程工具的SDK。每种模式都提供了实际代码示例帮助读者快速理解其使用方法和适用场景。无论你是想了解底层原理还是希望快速开发AI应用都能从中找到适合你的解决方案。此外文章还对比了各种模式的优劣并建议读者从HTTP API开始学习逐步掌握更高级的工具和技术。最近有个学员跟我说他去面试的时候面试官问了一个问题如果让你开发一个 AI 应用你会怎么做他自信满满地回答那还不简单调个 API 就行了呗。面试官追问就这一种方式你确定吗他直接懵了场面一度非常尴尬。其实这个问题很有代表性。很多同学对 AI 应用开发的认知还停留在「调 API」这个层面觉得能发个 HTTP 请求拿到 AI 的回答就完事儿了。但实际上调 API 只是最基础的一种方式。从最底层的 HTTP 请求到官方 SDK 封装到功能齐全的开发框架再到拖拽式的低代码平台还有一种鲜为人知的隐藏模式AI 应用开发的模式已经非常丰富了。今天就给大家一次性讲清楚目前主流的 5 种 AI 应用开发模式 到底是什么、怎么用、各自适合什么场景。每种模式我都会给一段简单的代码示例帮你快速理解。搞懂这些不仅面试的时候能应对自如用 AI 编程做项目的时候也能知道该往技术栈里加什么。一、HTTP API 直接调用最原始、最直接的方式就是通过 HTTP 请求调用大模型的 API 接口。简单来说就是你的程序给大模型发送一条消息大模型处理完之后把结果返回给你。这就像打电话给一个专家咨询问题。你得自己拨号码拼接 API 地址、报上身份传入密钥、把问题描述清楚构造请求体然后等专家回答完再自己记录下来解析响应。虽然每一步都得自己来但你对整个过程有完全的掌控。不管你用什么编程语言只要能发 HTTP 请求就能调用 AI 大模型。所以这是所有大模型服务商都支持的最基本的调用方式。无论是国外的 OpenAI 和 Anthropic、国内的 DeepSeek 和通义千问还是本地用 Ollama 部署的开源模型甚至是 OpenRouter 这类一个 API Key 就能调用多家模型的聚合平台都支持通过 HTTP API 来调用。目前 HTTP API 调用主要有两种协议格式。1OpenAI 兼容格式这套格式最初是 OpenAI 定义的但因为用的人多现在已经成了各家默认遵循的标准。DeepSeek、通义千问、Kimi、Ollama 等绝大多数大模型服务商都兼容这套格式。有统一标准的好处是你写一套调用大模型的代码只需要换个 API 地址和密钥就能无缝切换到不同厂商的模型不用重新适配格式。举个例子用 HTTP 请求工具 curl发一个 OpenAI 兼容格式的请求调用 DeepSeek 大模型curl https://api.deepseek.com/chat/completions / -H Authorization: Bearer 你的API密钥 / -H Content-Type: application/json / -d { model: deepseek-v4-pro, messages: [ {role: system, content: 你是一个有用的助手}, {role: user, content: 用一句话介绍什么是AI应用开发} ] }如果换成调用 OpenAI 的模型只需要把 URL 请求地址和 model 模型名称换一下就行请求格式完全一样。2Anthropic Messages API 格式AnthropicClaude 模型的开发商用的是自己独立的一套协议请求结构和 OpenAI 不太一样。比如系统提示词是放在顶层的system参数里而不是作为一条消息传入。如果你要调用 Claude 系列模型就得按它的格式来。curl https://api.anthropic.com/v1/messages / -H x-api-key: 你的API密钥 / -H content-type: application/json / -d { model: claude-sonnet-4-6, max_tokens: 1024, system: 你是一个有用的助手, messages: [ {role: user, content: 用一句话介绍什么是AI应用开发} ] }实际开发 AI 应用的时候你还需要了解请求和响应中各个字段的含义。最核心的是messages字段也就是你跟 AI 的对话消息列表此外还有temperature控制回答的随机性、max_tokens限制回答长度、响应里的usage字段能告诉你这次调用消耗了多少 Token 等等。各家平台一般都会提供详细的 API 文档照着文档来就行。大模型的 API 一般会提供两种调用方式。一种是普通请求一问一答等 AI 生成完整个回答后一次性返回。另一种是流式请求如果你想实现一个字一个字往外蹦的打字机效果就需要用到 SSEServer-Sent Events 流式传输协议让服务端把生成的内容一段一段地推送给你。用法也不复杂一般只需要在请求参数里把stream设置为 true 就行了。下面用 Python 写一个流式调用的例子感受一下打字机效果是怎么实现的import requests response requests.post( https://api.deepseek.com/chat/completions, headers{ Authorization: Bearer 你的API密钥, Content-Type: application/json }, json{ model: deepseek-chat, stream: True, # 开启流式输出 messages: [ {role: system, content: 你是一个有用的助手}, {role: user, content: 用一句话介绍什么是AI应用开发} ] }, streamTrue# 开启流式接收 ) # 逐行读取服务端推送的内容 for line in response.iter_lines(): if line: print(line.decode())二、官方 SDK 调用写过上面那段代码的同学应该能感受到直接用 HTTP 调用还是挺麻烦的。填写 URL、设置请求头、构造 JSON、解析响应、处理错误码、流式数据逐行解析…… 这些跟你的业务逻辑压根儿没关系但每一个都得自己处理。所以各大模型厂商都提供了 SDKSoftware Development Kit 软件开发工具包帮你把这些底层细节封装好了。如果 HTTP API 是自己拨号打电话那 SDK 就像装了一个智能通讯 APP。你只管说话APP 帮你自动拨号、接通、录音、整理成文字你拿到手的直接就是现成的答案。目前 OpenAI、Anthropic、Google、阿里云百炼、智谱等主流大模型服务商都提供了多语言的 SDK覆盖 Python、Java 等常用语言。SDK 的本质就是对 HTTP 请求的封装所以前面提到的 OpenAI 兼容格式在 SDK 层面同样适用。比如 DeepSeek 兼容 OpenAI 的协议那你直接用 OpenAI 的 SDK改个参数就能调用 DeepSeek 模型了。比如用 OpenAI 的 Python SDK 来调用 GPT 模型代码如下# 引入 OpenAI 官方 SDK from openai import OpenAI client OpenAI(api_key你的API密钥) completion client.chat.completions.create( modelgpt-5, messages[ {role: system, content: 你是一个有用的助手}, {role: user, content: 用一句话介绍什么是AI应用开发} ] ) print(completion.choices[0].message.content)不用填写 URL、不用设置请求头、不用手动解析 JSON几行代码就搞定了。而且 SDK 还内置了错误重试、类型提示、流式处理等功能让开发效率更高、代码更简洁、系统也更稳定。如果你用的是 DeepSeek 模型代码几乎一模一样只需要改一下 base_url 请求地址和 model 模型名称就行client OpenAI( api_key你的DeepSeek密钥, base_urlhttps://api.deepseek.com ) # 调用时把 model 换成 DeepSeek 的模型名 completion client.chat.completions.create( modeldeepseek-chat, messages[...] )三、AI 开发框架SDK 解决了 怎么方便地调模型 的问题但企业中的 AI 应用远不止调一下模型那么简单。你可能还需要让 AI 记住之前聊过什么会话记忆、让 AI 先去知识库里查资料再回答RAG 检索增强生成、让 AI 能调用外部工具比如查天气、搜网页工具调用、通过 MCP 协议接入更多外部服务、甚至让多个 AI 协同工作完成复杂任务……这些能力如果每个都自己从零开始写工作量巨大。所以就有人在 SDK 的基础上又封装了一层做成了 AI 开发框架。打个比方SDK 相当于给你提供了发动机、轮胎、方向盘这些零件你得自己一个一个装配AI 开发框架相当于直接给你一辆半成品车底盘、车架、电路都搭好了你只需要决定外观和内饰就能上路。下面以 Python 和 Java 为例列举几个主流的 AI 开发框架之后你在 AI 编程时看到这些技术名词就不会感到陌生了。Python 生态中LangChain 是目前最主流的 AI 应用开发框架提供了大量集成组件涵盖模型调用、RAG 知识库、工具调用、MCP 集成等常用能力。LangGraph 是 LangChain 团队推出的进阶框架用图的结构来编排复杂的 AI 工作流适合构建有状态的、需要循环和分支逻辑的 AI 智能体。举个例子用 LangChain 调用模型的代码长这样from langchain.chat_models import init_chat_model from langchain.messages import HumanMessage, SystemMessage model init_chat_model(gpt-5) messages [ SystemMessage(你是一个有用的助手), HumanMessage(用一句话介绍什么是AI应用开发) ] response model.invoke(messages) print(response.content)看起来和 SDK 差不多对吧但 LangChain 的价值在于当你需要加上记忆、工具调用这些高级能力时只需要几行配置就能搞定不用自己从零实现。比如创建一个带工具调用能力的 AI Agentfrom langchain.agents import create_agent from langchain.tools import tool # 定义一个工具让 AI 能查天气 tool def get_weather(city: str) - str: 查询指定城市的天气 return f{city}今天晴25°C # 一行代码创建带工具调用能力的 Agent agent create_agent(modelgpt-4o, tools[get_weather]) # 调用 Agent它会自动判断是否需要调用工具 result agent.invoke( {messages: [{role: user, content: 北京今天天气怎么样}]} )这样 AI 就能主动调用工具去查天气了你只需要定义好工具函数LangChain 帮你搞定剩下的。而且很多其他语言生态的 AI 开发框架在设计上几乎都参考了 LangChain 的思路比如 Java 的 LangChain4j、Go 的 LangChainGo功能上和 Python 版基本对齐学会一个版本切到其他语言也很容易上手。Java 生态还有 Spring 官方推出的 Spring AI 以及阿里的 Spring AI Alibaba深度融入 Spring Boot 生态适合 Java 后端开发者快速上手。另外 Vercel AI SDK 也值得大家关注它是 TypeScript 生态的 AI 开发框架提供了 20 多个模型供应商的统一接口特别适合前端和全栈开发者。四、低代码 AI 开发平台框架虽然功能强大但写代码终归是有门槛的。特别是业务人员或者不太会编程的同学光是搭个开发环境就够头疼的了。这时 低代码 AI 开发平台 就派上用场了不用写代码也能搭出 AI 应用。打个比方低代码平台就像搭积木。大模型是一块积木知识库是一块积木工具调用是一块积木每块积木都是现成的你只需要决定怎么拼接、拼成什么形状就好了。Dify 是典型的低代码 AI 开发平台它支持通过可视化界面搭建 AI 聊天助手、工作流、知识库问答等应用还能一键接入各种大模型。它最大的优势是开源、可私有化部署企业想把数据放在自己服务器上也没问题。在 Dify 上搭一个 AI 聊天助手大概就这么几步选择一个大模型比如 GPT-5.5 或 DeepSeek写一段系统提示词告诉 AI 它的角色配置知识库可选上传你的文档资料点击发布就能得到一个可调用的 API 或者直接分享的聊天链接整个过程不需要写一行代码。类似的平台还有不少比如字节跳动的 Coze扣子也支持可视化搭建 AI 应用容易上手阿里云百炼是一站式的大模型应用构建平台集成了模型调用、智能体编排、知识库管理等能力还有开源的工作流自动化平台 n8n擅长做跨系统的 AI 自动化流程。五、AI 编程工具的 SDK前面 4 种模式覆盖了从手动写代码、到完全不写代码的各种方案。但还有一种很多同学不知道的模式。。。2026 年Cursor、Claude Code、GitHub Copilot 等 AI 编程工具纷纷推出了自己的 SDK。你可以在自己的代码里直接调用这些 AI 编程工具的 Agent它们能帮你读代码、改代码、跑命令而且你在 AI 编程工具里配置好的 MCP 服务、Skills、项目规则这些能力通过 SDK 调用时同样能生效。如果说前面那些方式都是你自己动手干活那么使用 AI 编程工具的 SDK 相当于你雇了一个会写代码的 AI 程序员。你只需要告诉它做什么它会自动读文件、分析代码、完成开发。以 Cursor SDK 为例允许你在 TypeScript / Node.js 代码中直接调用 Cursor 的 AI Agent。先新建项目文件夹然后打开终端在该目录下输入一行命令安装 SDKnpm install cursor/sdk然后登录 Cursor Dashboard在 Integrations 页面生成一个 API Key 并保存下来后面代码里需要用它来验证身份。假设本地有一个「创作选题获取器」项目里面用 AGENTS.md 定义了选题获取的工作流规则还安装了 frontend-design 前端设计技能。现在想让 AI 帮我获取今天的热门选题并生成一个漂亮的网页报告。新建一个 JavaScript 文件比如main.js写入以下代码import { Agent } from cursor/sdk; // 创建 AI Agent指向「创作选题获取器」项目 const agent await Agent.create({ apiKey: 你的 API Key, model: { id: gpt-5.5 }, local: { cwd: /Users/yupi/workflow/创作选题获取器 }, }); // 一句话下达指令 const run await agent.send(帮我获取今日 AI 领域的热门选题并生成一个网页报告); // 收集所有事件打印到终端的同时保存到文件 const events []; for await (const event of run.stream()) { console.log(event); events.push(event); } // 把完整的事件记录保存为 JSON 文件方便事后分析 const fs awaitimport(fs); fs.writeFileSync(agent-output.json, JSON.stringify(events, null, 2));然后在终端执行node main.js运行后你会在终端看到一连串事件输出比如 Agent 开始执行。从日志里可以清晰地看到 Agent 的整个执行过程它先用glob工具扫描了项目目录然后用read工具依次读取了 AGENTS.md 工作流规则和 frontend-design 的 SKILL.md 技能说明接着通过shell工具调用了项目里的热点获取脚本进行联网搜索从 GitHub、Hacker News 等 6 个平台采集了 70 条热门话题再通过edit命令生成了一个近千行代码的 HTML 网页报告。最后 Agent 还自动打开了浏览器让你直接查看生成的选题报告。你会发现整个过程和在 Cursor 编辑器里跟 AI 对话一模一样。但区别在于现在你是用代码来调用它的这意味着你可以把它嵌入到 CI/CD 流水线、自动化脚本、甚至自己的产品里。普通的大模型 SDK 只能帮你生成文本而 AI 编程工具的 SDK 能帮你直接操作代码库、调用工具、生成文件。如果只是一次性的简单任务还有更简洁的写法const result await Agent.prompt( 给这个项目写一个 README.md, { apiKey: process.env.CURSOR_API_KEY!, model: { id: composer-2 }, local: { cwd: process.cwd() }, } );前面演示的是本地运行模式Agent 直接在你自己的电脑上跑适合开发调试。除此之外Cursor SDK 还支持 Cursor 托管云模式Cursor 帮你在云端开一台隔离的虚拟机来执行任务适合同时跑多个 Agent 并行处理以及自托管云模式你自己管理服务器适合企业内部使用。有了 AI 编程工具的 SDK 后你甚至可以把 AI 编程工具当成一种开发环境就像部署项目需要配置数据库一样在服务器上配好 AI 编程工具的环境然后在代码中通过 SDK 来调用实现自动化的代码生成、审查、重构等任务。除了 CursorAnthropic 的 Claude Agent SDK 和 GitHub 的 Copilot SDK 也提供了类似的能力用法大同小异。怎么选择讲完了 5 种 AI 应用开发模式那实际开发的时候到底该选哪种呢这里我帮大家做了一个简单的对比模式一句话总结适合谁HTTP API自己拼请求调模型最底层最灵活想了解底层原理、或 SDK 不支持的语言官方 SDK用官方封装好的工具包调模型大多数开发者的日常开发AI 开发框架记忆、RAG、工具调用等能力开箱即用需要开发完整 AI 应用的团队低代码平台拖拽搭建不用写代码非技术人员、快速验证想法AI 编程工具 SDK让 AI Agent 帮你写代码想把 AI 编程能力集成到自动化流程中注意这 5 种模式之间并不是互相排斥的实际开发中经常会混着用。比如用低代码平台快速搭个原型验证想法验证通过后再用开发框架重写成正式版本或者在框架搭好的项目里某些模块直接用 HTTP API 调一个特殊接口。选择的核心原则是用最少的成本解决当前的问题。 能拖拽解决的就别写代码能用框架搞定的就别自己造轮子能用 SDK 的就别手撸 HTTP。不过如果你是在学习阶段我建议反过来从 HTTP API 开始一步步往上走。这样对每一层的原理都能有清晰的理解后面用更高层的工具也不会一头雾水。最后哔哔AI 应用开发这个领域变化太快了新框架、新工具几乎每个月都在冒出来。但万变不离其宗底层就是这几种模式。搞懂了这些不管未来出什么新工具你都能快速定位它属于哪一层、解决什么问题。回到开头那个面试场景如果你能把这 5 种模式的适用场景和优劣讲清楚面试官大概率会对你刮目相看。最后如果说程序员已经是高薪职业那么干AI的程序员就是高薪中的高薪。现在的市场已经用数据给程序员指明了方向学AI大模型就是冲刺高薪的最优解看着身边越来越多的同行转型大模型、拿到高薪offer很多人心里都动了心但真正的难题来了零基础小白不知道从哪入门有基础的程序员找不到系统学习路径实战项目练手无门面试不知道考什么别慌今天就给大家整理了一份【2026年最新版】AI大模型免费学习资源包覆盖从入门到实战、从理论到面试、从基础到进阶的全流程所有资料均已整理归档无冗余、无套路免费分享给每一位想抓住AI风口的程序员和小白扫码免费领取全部内容1、大模型系统化学习路线2、大模型学习书籍文档3、AI大模型最新行业报告4、大模型项目实战配套源码5、大模型大厂面试真题四阶段精细化学习规划附时间节点可直接照做结合上述资源给大家整理了一份可直接落地的四阶段学习规划总时长约2个月小白可循序渐进程序员可根据自身基础调整节奏高效掌握大模型核心能力快速实现从“入门”到“能落地、能面试”的跨越。第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。到此为止大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器 损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…扫码免费领取全部内容6、这些资料真的有用吗这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】