Android开发转AI Agent：第11天——Chroma向量数据库，3行替代手写10行检索

发布时间：2026/6/30 12:50:19

作者一位Android开发工程师 | 2026年6月29日系列第10天手写了完整RAG今天用专业工具替代手写部分前言第9/10天我手写了向量检索——for 循环余弦相似度排序。这在知识库只有 5 条文档时没问题但如果知识库有 5000 条手写循环就太慢了。今天学 Chroma——一个专门做向量存储和检索的数据库。对比手写 vs Chroma手写版第10天8行q_vecmodel.encode(question)results[]fordocindocs:vecmodel.encode(doc)simnp.dot(vec,q_vec)/(norm(vec)*norm(q_vec))results.append((sim,doc))results.sort(reverseTrue)top3[docfor_,docinresults[:3]]Chroma 版3行collectionclient.create_collection(namemy_docs)collection.add(documentsdocs,idsids)resultscollection.query(query_texts[question],n_results3)Chroma 替你做了三件事向量化存储检索。完整代码importchromadbfromsentence_transformersimportSentenceTransformer# 自定义 Embedding 函数用本地中文模型classLocalEmbedding(EmbeddingFunction):def__init__(self):self.modelSentenceTransformer(shibing624/text2vec-base-chinese)def__call__(self,input):returnself.model.encode(input).tolist()# Chroma 核心 4 行clientchromadb.Client()collectionclient.create_collection(namemy_docs,embedding_functionLocalEmbedding())collection.add(documentsdocs,ids[fdoc_{i}foriinrange(len(docs))])resultscollection.query(query_texts[协程怎么管理生命周期],n_results3)踩坑中文模型选择一开始用all-MiniLM-L6-v2结果协程怎么管理生命周期检索到的第一条是 Room 数据库相关——不是生命周期那条。原因all-MiniLM-L6-v2对中文语义理解不够精确。换成专为中文优化的shibing624/text2vec-base-chinese后检索准确了——生命周期那条排到了第一。教训做中文 RAG 一定要用中文 Embedding 模型。Chroma 核心 4 行需要记住的clientchromadb.Client()# 1. 创建客户端collectionclient.create_collection(namexxx)# 2. 建集合类似 CREATE TABLEcollection.add(documentsdocs,idsids)# 3. 添加文档resultscollection.query(query_texts[q],n_results3)# 4. 查询今天的一句话总结Chroma 就是把第9天手写的 for 循环余弦相似度排序封装成了collection.query()一行。就像用 Room 数据库替代手写 SQLite——专业工具让代码更简洁。下一篇预告第12天Function Calling——让 LLM 不再只是说而是能做。Agent 最关键的能力。本系列记录一位Android开发者转行AI Agent的完整学习过程欢迎关注交流。

ICM-42688-P与STM32L432KC在机器人控制与工业监测中的应用

1. ICM-42688-P与STM32L432KC的黄金组合解析在机器人控制和工业监测领域，传感器与处理器的协同设计往往决定着系统性能的上限。ICM-42688-P作为TDK InvenSense最新的6轴MEMS运动传感器，其核心价值在于0.0039/s/√Hz的陀螺仪噪声密度和750g/√Hz的加速度计…

2026/6/30 12:49:38 阅读更多

工业物联网网关PCBA的三防漆涂覆策略 | 广州华创精密|HCJMPCBA

一、工业物联网网关PCB的环境威胁矩阵工业物联网网关与普通消费级网络设备有着本质区别——它们通常部署于无温控的户外机柜、工厂车间以及偏远的现场边缘站点。这些严苛的运行环境使裸露的印刷电路板组件面临四大破坏性因素：-40C至85C的极端温度循环、高湿度凝露…

2026/6/30 12:49:38 阅读更多

低成本6DOF运动追踪系统设计与实现

1. 从零搭建6DOF运动追踪系统去年在开发一款工业级AR设备时，我遇到了一个棘手问题：如何在不依赖外部基站的情况下，实现毫米级精度的三维空间定位？经过多轮方案对比，最终选择了ICM-42605STM32F373VC这套组合。这个方案最…

2026/6/30 12:49:38 阅读更多

Citra模拟器完全指南：在PC上畅玩任天堂3DS游戏的终极教程

Citra模拟器完全指南：在PC上畅玩任天堂3DS游戏的终极教程【免费下载链接】citra A Nintendo 3DS Emulator 项目地址: https://gitcode.com/gh_mirrors/cit/citra 想要在电脑上重温《精灵宝可梦》、《动物之森》等经典任天堂3DS游戏吗？Citra模拟器…

2026/6/30 15:43:51 阅读更多

CAD Exchanger SDK 3.22.0 新特性全解析：Docker化部署与多格式深度支持

1. Docker化部署：开发环境一键搞定记得第一次手动配置CAD Exchanger SDK开发环境时，光是处理C依赖项就花了整整两天。现在3.22.0版本直接甩出四个预配置好的Docker镜像（C/C#/Java/Python），就像把全套工具打包成即食罐…

2026/6/30 15:43:28 阅读更多

保姆级教程：用谷歌开源的RT-1代码，在本地复现Transformer机器人控制

从零部署RT-1：Transformer机器人控制实战指南当Transformer架构在NLP和CV领域大放异彩时，谷歌悄然将其引入机器人控制领域，推出了惊艳的RT-1模型。这个能处理700多种指令、成功率高达97%的系统，如今代码已完全开源。本文将带你深入…

2026/6/30 15:43:28 阅读更多

企业级数字营销：GEO技术如何重构本地化竞争？

对于企业级服务市场而言，地理信息优化（GEO）能力正成为数字化营销的基础设施。具备成熟技术解决方案的服务商，正在通过以下维度重构本地化营销的竞争格局：一、技术架构差异化头部服务商的系统通常包含三个层级&#xf…

2026/6/30 15:43:08 阅读更多

5分钟搞定Windows安装APK：跨平台应用部署利器

5分钟搞定Windows安装APK：跨平台应用部署利器【免费下载链接】APK-Installer An Android Application Installer for Windows 项目地址: https://gitcode.com/GitHub_Trending/ap/APK-Installer 还在为Android应用无法在Windows上直接安装而烦恼吗&#xff…

2026/6/30 15:42:47 阅读更多

如何三分钟搞定网盘直链下载：LinkSwift下载助手完整使用指南

如何三分钟搞定网盘直链下载：LinkSwift下载助手完整使用指南【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ，支持百度网盘 / 阿里云盘 / 中国移动云盘 …

2026/6/30 15:42:26 阅读更多

Google限制Meta使用Gemini模型凸显AI授权竞争白热化

近日，据多家科技媒体报道，Google已对Meta施加限制，禁止其在部分产品或服务中直接使用Gemini AI模型。这一消息一经传出，便在人工智能领域掀起波澜，凸显出当前大厂间AI模型授权竞争的激烈程度。新闻导语：根…

2026/6/30 0:01:09 阅读更多

XGBoost超参数实战：从理论到调优策略

1. XGBoost超参数基础认知第一次接触XGBoost时，我被它那密密麻麻的参数列表吓到了。这感觉就像面对一架波音747的驾驶舱——每个按钮都可能有神奇的效果，但按错了就可能坠机。经过多年实战，我发现其实掌握十几个核心参数就能解决90%的问题。…

2026/6/30 0:02:51 阅读更多

ChatGPT函数调用从入门到高并发落地：3步完成生产级集成，附可直接运行的TypeScript+Python双模版

更多请点击： https://kaifayun.com 第一章：ChatGPT函数调用的核心原理与演进脉络函数调用（Function Calling）是大语言模型从纯文本生成迈向结构化交互的关键跃迁。其本质并非模型原生具备“执行代码”的能力，而是通…

2026/6/30 0:04:11 阅读更多

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

6个月前的2025年12月，Boris Cherny 公开宣布自己卸载了 IDE。一时间，Vibe Coding 成了全行业最热的话题。6个月后，当我们回过头来拉一份真实账本，发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/6/30 0:04:06 阅读更多

华为OD机试2025C卷-字符统计及重排[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

📫 个人主页：深夜coding算法 📣 专栏系列：2026年华为最新OD机试题库详解 🔥 一次订阅，永久解锁 | 持续更新100篇 | 6语言全覆盖文章目录❄️前言：☀️一：题目描述🌙 题目…

2026/6/30 1:24:32 阅读更多

华为OD机试2025C卷-寻找相同子串[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

2026/6/30 1:24:32 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/30 13:13:17 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/30 13:45:12 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/30 13:45:12 阅读更多

相关文章

ICM-42688-P与STM32L432KC在机器人控制与工业监测中的应用

工业物联网网关PCBA的三防漆涂覆策略 | 广州华创精密|HCJMPCBA

低成本6DOF运动追踪系统设计与实现

Citra模拟器完全指南：在PC上畅玩任天堂3DS游戏的终极教程

CAD Exchanger SDK 3.22.0 新特性全解析：Docker化部署与多格式深度支持

保姆级教程：用谷歌开源的RT-1代码，在本地复现Transformer机器人控制

企业级数字营销：GEO技术如何重构本地化竞争？

5分钟搞定Windows安装APK：跨平台应用部署利器

如何三分钟搞定网盘直链下载：LinkSwift下载助手完整使用指南

Google限制Meta使用Gemini模型 凸显AI授权竞争白热化

XGBoost超参数实战：从理论到调优策略

ChatGPT函数调用从入门到高并发落地：3步完成生产级集成，附可直接运行的TypeScript+Python双模版

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

华为OD机试2025C卷-字符统计及重排[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

华为OD机试2025C卷-寻找相同子串[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

Google限制Meta使用Gemini模型凸显AI授权竞争白热化