LangChain4j 开发Java Agent智能体- 嵌入模型与向量数据库

发布时间：2026/6/9 19:12:58

大家好我是Java1234_小锋老师最近更新《2027版本 LangChain4j 开发Java Agent 智能体视频教程》专辑感谢大家支持。本课程主要介绍和讲解 LangChain4j 简介阿里云百炼大模型平台接入Ollama简介以及安装和使用HelloWorld 实现日志配置集成SpringBootAi Service 使用对话与提示词工程(Prompt)结构化输出会话记忆工具调用(Function Calling)嵌入模型与向量数据库RAG(检索增强生成)MCP(模型上下文协议)多模态支持视频教程课件源码打包下载链接https://pan.baidu.com/s/1o-zRfndo1HHrS_uFroOiCw?pwd1234提取码0000LangChain4j 开发Java Agent智能体- 嵌入模型与向量数据库一什么是嵌入模型1.1 什么是嵌入简单来说嵌入Embedding是一种将非数字数据如单词、句子、图像、甚至整个文档转换为计算机能够理解的数字向量的技术。向量是数学、物理学及工程科学中的基础概念指同时具有大小和方向的量‌与只有大小没有方向的标量如温度、质量相对。‌‌数据比如一句话“我喜欢吃苹果”。向量经过嵌入模型处理后这句话会变成一个由数百个浮点数组成的数组例如[0.125, -0.342, 0.987, ..., 0.045]。这个向量不是随机生成的它通过复杂的神经网络模型训练得出能够捕获原始数据的语义信息。1.2 嵌入模型的核心作用将“意义”映射到“向量空间”嵌入模型最关键的特性是它会把相似的语义内容映射到向量空间中的相近位置。例子句子A“我喜欢吃苹果”句子B“我爱吃香蕉”句子C“火箭发射升空”经过嵌入模型后在向量空间中句子A和句子B的距离会非常近因为都是表达对水果的喜爱。句子C与A、B的距离会非常远因为讨论的是完全不同的主题。1.3 为什么需要嵌入模型语义搜索传统的搜索引擎依赖关键词匹配比如搜索“苹果”只会返回包含“苹果”这两个字的结果。而基于嵌入的搜索是语义上的理解和匹配即使搜索“一种富含维生素的水果”也能找到关于“苹果”的文档。信息压缩与表示将一个复杂的对象图片、长文本压缩成一个固定长度的、富含语义信息的向量。作为大模型的“外部记忆”这是最广泛的应用之一。大模型的知识是静态的训练到某个时间点且上下文窗口有限。通过嵌入我们可以将海量的私有知识公司文档、产品手册向量化然后在需要时检索出最相关的部分再“喂”给大模型让它基于这些知识回答问题从而解决模型的知识局限和幻觉问题。1.4 常见嵌入模型OpenAI 的 text-embedding-3-small 和 text-embedding-3-large目前性能强大的通用文本嵌入模型。BAAI/bge-* 系列北京智源研究院开源的优秀中英文嵌入模型。sentence-transformers一个非常流行的Python库提供了大量预训练的句子、段落嵌入模型。多模态嵌入模型如CLIP可以将图片和文本嵌入到同一个向量空间实现文本搜图、图搜图等功能。阿里百炼平台的嵌入模型项目里application.yml里我们指定下嵌入模型和维度langchain4j:open-ai:embedding-model:api-key:${OPENAI_API_KEY}model-name:text-embedding-v4base-url:https://dashscope.aliyuncs.com/compatible-mode/v1dimensions:1024# 可选v4 支持 64/128/256/512/768/1024/1536/2048log-requests:truelog-responses:true然后controller包下新建MyEmController以及注入embeddingModel新建em测试方法。packagecom.java1234.controller;importdev.langchain4j.data.embedding.Embedding;importdev.langchain4j.model.embedding.EmbeddingModel;importdev.langchain4j.model.output.Response;importorg.springframework.beans.factory.annotation.Autowired;importorg.springframework.web.bind.annotation.RequestMapping;importorg.springframework.web.bind.annotation.RestController;importjava.util.Arrays;RestControllerpublicclassMyEmController{AutowiredprivateEmbeddingModelembeddingModel;RequestMapping(/em)publicStringem(){ResponseEmbeddingresponseembeddingModel.embed(学java上java1234.com);float[]vectorresponse.content().vector();// 浮点数组intdimresponse.content().dimension();// 维度应与 dimensions 配置一致System.out.println(Arrays.toString(vector):vector.length:dim);returnOK;}}浏览器运行测试http://localhost:8080/em我们在看一个示例求下欧氏距离距离越小说明越相似RequestMapping(/em2)publicStringem2(){float[]textVector1embeddingModel.embed(学java上java1234.com).content().vector();float[]textVector2embeddingModel.embed(java1234.com网站教学Java质量真不错).content().vector();float[]textVector3embeddingModel.embed(我喜欢吃苹果).content().vector();doubledist12euclideanDistance(textVector1,textVector2);doubledist13euclideanDistance(textVector1,textVector3);System.out.println(textVector1 与 textVector2 欧氏距离: dist12);System.out.println(textVector1 与 textVector3 欧氏距离: dist13);returnOK;}/** * 计算两个向量的欧式距离 * param a * param b * return */publicstaticdoubleeuclideanDistance(float[]a,float[]b){if(a.length!b.length){thrownewIllegalArgumentException(向量维度不一致);}doublesum0;for(inti0;ia.length;i){doubleda[i]-b[i];sumd*d;}returnMath.sqrt(sum);}越相似距离值越小。二什么是向量数据库2.1 什么是向量数据库向量数据库是一种专门设计用来存储、索引和查询向量数据的数据库。传统的关系型数据库擅长存储和查询结构化数据如表格中的姓名、年龄但它们无法高效处理向量的“相似性检索”需求。2.2 向量数据库的核心功能相似性搜索向量数据库的核心能力是近似最近邻检索。任务给定一个查询向量在数据库中快速找到与之最相似的K个向量。算法它不进行暴力的一一比对而是使用专门的索引算法如 HNSW——分层可导航小世界图IVF——倒排文件索引来极大地提高搜索效率。即便数据库中有十亿个向量也能在毫秒级内返回结果。距离度量通常通过计算向量之间的“距离”来衡量相似度。余弦相似度衡量方向上的相似度最常用。欧氏距离衡量空间中的直线距离。点积衡量两个向量的投影。2.3 为什么需要向量数据库高效的检索性能专为大规模向量相似性搜索优化这是传统数据库无法做到的。元数据过滤在实际应用中向量通常还附带元数据。例如一个商品图片的向量可能还附有“商品ID”、“价格”、“类别”等信息。向量数据库允许你在进行相似性搜索时先或同时根据这些元数据进行过滤例如“找到与这件红色T恤最相似的衣服且价格低于100元”。数据管理提供增删改查、数据持久化、备份、容灾等标准的数据库功能。与嵌入模型和大模型的完美集成它们共同构成了现代AI应用如RAG——检索增强生成的数据流水线。2.4 常用的向量数据库有哪些以下是5个最常用的向量数据库对比表格数据库类型特点优点适用场景Pinecone商业SaaS全托管云服务上手最快零运维提供免费额度快速原型开发不想自己搭建维护的项目Milvus开源/商业功能最全面的专业向量数据库支持十亿级向量索引类型丰富性能强大大规模生产环境对性能要求高的场景Qdrant开源/商业Rust编写性能优异内存占用低API友好支持过滤需要高性能、资源受限的环境Chroma开源Python原生轻量级极简API与LangChain集成好本地开发友好本地开发、学习、小型项目pgvectorPostgreSQL扩展基于PostgreSQL支持ACID事务SQL语法无需引入新数据库已有PostgreSQL向量数据量百万级以内三两者的协同工作 —— RAG流程示例这是目前最经典的AI应用架构可以清晰地看到嵌入模型和向量数据库是如何配合的。场景构建一个基于公司内部知识库的智能问答机器人。第一步数据预处理与索引入库阶段准备文档收集所有公司文档PDF、Word、内部Wiki等。文本分块将长文档切分成更小的段落或“块”。生成嵌入使用嵌入模型为每一个文本块生成一个向量。存储将生成的向量连同原始的文本块和相关的元数据如文档来源、页码一起存入向量数据库。第二步用户提问与检索查询阶段用户提问用户问“我们公司的年假政策是什么”问题嵌入使用相同的嵌入模型将用户的这个问题也转换成一个向量。向量检索将这个代表问题的向量发送到向量数据库进行查询。数据库会迅速返回与问题向量最相似的K个文本块向量。获取上下文根据返回的向量ID取出对应的原始文本块内容。第三步生成答案生成阶段构建提示词将用户的问题检索到的相关文本块作为上下文组合成一个提示词。调用大语言模型将提示词发送给大语言模型如GPT-4并指示它“请根据提供的上下文回答问题”。返回答案大模型阅读并理解上下文后生成一个准确、有据可依的答案返回给用户。LangChain4j支持的向量数据库还是比较多的。我们课程选用Redis。之前已经在Docker Desktop里安装了redis镜像。接下来项目里把向量存入Redis-stack向量数据库。首先启用redis向量配置修改application.ymllangchain4j:community:redis:enabled:true# 关闭 Redis 向量库自动配置仅保留手动配置的会话记忆host:localhostport:6379dimension:1024# 与 text-embedding-v4 一致也可省略starter 会从 EmbeddingModel 自动读取index-name:embedding-indexprefix:java1234:MyEmController注入embeddingStore嵌入存储/** * 嵌入存储 */AutowiredprivateEmbeddingStoreTextSegmentembeddingStore;添加文档实现RequestMapping(/addDoc)publicStringaddDoc(){// 清空旧数据避免重复调用产生重复文档embeddingStore.removeAll();ListStringdocsList.of(学java上java1234.com,java1234.com是个学Java的好地方,我喜欢打篮球);for(Stringtext:docs){TextSegmentsegmentTextSegment.from(text);// 创建文本片段EmbeddingembeddingembeddingModel.embed(segment).content();// 创建嵌入向量embeddingStore.add(embedding,segment);// 添加文档}returnOK;}查询实现RequestMapping(/query)publicStringquery(){EmbeddingqueryEmbeddingembeddingModel.embed(去哪里学Java ?).content();EmbeddingSearchRequestrequestEmbeddingSearchRequest.builder().queryEmbedding(queryEmbedding).maxResults(2).build();ListEmbeddingMatchTextSegmentmatchesembeddingStore.search(request).matches();for(EmbeddingMatchTextSegmentmatch:matches){System.out.println(match.embedded().text());}returnOK;}我们先测试添加文档http://localhost:8080/addDocredis里查看下已经入库了再进行相似性搜索http://localhost:8080/query

Unity3D解谜游戏工程包：带多场景、线索提示与完整可运行解密逻辑

本文还有配套的精品资源，点击获取简介：这是一个开箱即用的Unity3D解谜小游戏工程，无需额外插件或配置，导入后即可直接运行。项目内置多个风格化3D场景，包括TheWilds（荒野）、Snow&#xff08…

2026/6/9 19:11:57 阅读更多

单片机通用定时器编码器接口实验

单片机 ：STM32F407 开发板：DMF407电机开发板平台：keil V5.31HSE 为8MHZ HSI为16MHZ原理图：一、编码器接口一：主函数：int main(void) { uint8_t i 0;HAL_Init(); /* 初…

2026/6/9 19:10:15 阅读更多

Havenlon 系统术语解读：从信任到执行控制

很多人第一次接触 Havenlon 时，会遇到一组新的系统术语：Execution Control Layer、Physical Trust Boundary、Intent、Arbiter、Executor、Pass Key、Auth Key、Enigma Hub、Bletchley SaaS。这些词看起来像是产品命名，但它们背后对应的并不是…

2026/6/9 19:08:55 阅读更多

GoGoGo：终极Android虚拟定位工具，无需ROOT实现摇杆控制定位

GoGoGo：终极Android虚拟定位工具，无需ROOT实现摇杆控制定位【免费下载链接】GoGoGo 一个基于 Android 调试 API 百度地图实现的虚拟定位工具，并且同时实现了一个可以自由移动的摇杆项目地址: https://gitcode.com/GitHub_Trending/go/Go…

2026/6/9 20:20:28 阅读更多

n8n 开源、可自托管的「可视化工作流自动化平台」

n8n（发音：n-eight-n） 开源、可自托管的「可视化工作流自动化平台」，一句话：用拖拽代替写代码，把各种软件 / API / 数据库 / AI 串起来自动跑。名字来自 node automation（nodemation&#xff09…

2026/6/9 20:20:28 阅读更多

250+款Xshell配色方案终极指南：一键美化你的终端界面

250款Xshell配色方案终极指南：一键美化你的终端界面【免费下载链接】Xshell-ColorScheme 250 Xshell Color Schemes 项目地址: https://gitcode.com/gh_mirrors/xs/Xshell-ColorScheme 还在忍受单调的黑白命令行吗？每天面对相同的终端颜色不仅让…

2026/6/9 20:19:07 阅读更多

免费AI音频处理终极指南：用OpenVINO插件让Audacity变身专业工作室

免费AI音频处理终极指南：用OpenVINO插件让Audacity变身专业工作室【免费下载链接】openvino-plugins-ai-audacity A set of AI-enabled effects, generators, and analyzers for Audacity. 项目地址: https://gitcode.com/gh_mirrors/op/openvino-plugins-ai-aud…

2026/6/9 20:18:26 阅读更多

猫抓浏览器扩展：终极网页媒体资源嗅探与下载解决方案完全指南

猫抓浏览器扩展：终极网页媒体资源嗅探与下载解决方案完全指南【免费下载链接】cat-catch 猫抓浏览器资源嗅探扩展 / cat-catch Browser Resource Sniffing Extension 项目地址: https://gitcode.com/GitHub_Trending/ca/cat-catch 想要轻松下载网页中的视频…

2026/6/9 20:18:05 阅读更多

Sqribble：轻量级文档编排引擎与自动化出版原理

1. 项目概述：当模板不再是“套壳”，而是一套可执行的文档操作系统你有没有过这种体验：手头有一篇写得不错的行业分析，想快速做成一份体面的PDF报告发给客户，结果打开Word或InDesign，光是调封面字体、对齐目…

2026/6/9 20:17:24 阅读更多

5分钟上手：BilibiliDown——你的B站视频下载全能助手

5分钟上手：BilibiliDown——你的B站视频下载全能助手【免费下载链接】BilibiliDown (GUI-多平台支持) B站哔哩哔哩视频下载器。支持稍后再看、收藏夹、UP主视频批量下载|Bilibili Video Downloader 😳 项目地址: https://gitcode.com/gh_mirrors/bi…

2026/6/9 0:00:38 阅读更多

【AI】服务化部署：把AI Agent变成API服务

服务化部署：把AI Agent变成API服务📝 本章学习目标：本章聚焦安全与工程化，确保AI Agent稳定可靠运行。通过本章学习，你将全面掌握"服务化部署：把AI Agent变成API服务"这一核心主题。一、引言&…

2026/6/9 0:01:41 阅读更多

Playnite：一站式游戏库管理器，告别多平台切换烦恼

Playnite：一站式游戏库管理器，告别多平台切换烦恼【免费下载链接】Playnite Video game library manager with support for wide range of 3rd party libraries and game emulation support, providing one unified interface for your games. 项目地…

2026/6/9 0:01:41 阅读更多

LED驱动技术全解析：从核心架构到实战选型与避坑指南

1. 从一颗灯珠到千亿市场：LED驱动的技术演进与商业逻辑十几年前，当我第一次从料盘上拿起一颗0603封装的白色LED时，它微弱的光晕和高达几块钱的单颗成本，让我很难想象今天它几乎照亮了我们生活的每一个角落。从手机屏幕的一抹背光&…

2026/6/9 0:23:00 阅读更多

索引堆及其优化

索引堆及其优化引言索引堆是一种数据结构，广泛应用于计算机科学和软件工程领域。它主要用于解决优先队列问题，如最小堆和最大堆。本文将详细介绍索引堆的概念、实现方法以及优化策略。索引堆的定义索引堆是一种基于堆数据结构的索引机制。它通过维护一个堆来存储数据…

2026/6/9 0:23:12 阅读更多

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

更多请点击： https://intelliparadigm.com 第一章：CSDN AI 数字营销的官方引流卡片是什么功能？ CSDN AI 数字营销平台推出的「官方引流卡片」，是一种面向技术创作者的轻量级、可嵌入式内容分发组件，专为提升博文、教程…

2026/6/9 0:15:30 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/9 9:53:26 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…