MacBook上从零搞定LangChain：Python3、ChromaDB和OpenAI API的保姆级配置指南

发布时间：2026/5/30 6:14:24

MacBook上从零搞定LangChainPython3、ChromaDB和OpenAI API的保姆级配置指南刚拿到MacBook的新手开发者面对LangChain这个强大的AI应用框架时往往会感到无从下手。本文将带你一步步完成从环境配置到第一个LangChain应用的完整流程即使你之前从未接触过命令行操作也能轻松上手。1. 基础环境准备Python3与包管理工具在Mac上配置LangChain开发环境首先需要确保Python3的正确安装。虽然macOS自带Python但系统自带的版本通常较旧且不建议直接使用。以下是详细的安装步骤1.1 安装Homebrew与Python3Homebrew是macOS上最受欢迎的包管理工具能极大简化软件安装过程。打开终端Terminal输入以下命令安装Homebrew/bin/bash -c $(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)安装完成后将Homebrew添加到环境变量echo eval $(/opt/homebrew/bin/brew shellenv) ~/.zshrc source ~/.zshrc现在可以通过Homebrew安装Python3brew install python3.10提示如果遇到Updating Homebrew...卡住的情况可以按ControlC跳过更新直接安装。验证Python安装python3 --version1.2 配置Python环境变量为了避免与系统Python冲突建议设置别名echo alias python/opt/homebrew/bin/python3 ~/.zshrc echo alias pip/opt/homebrew/bin/pip3 ~/.zshrc source ~/.zshrc现在输入python --version应该能看到正确的Python3版本。1.3 解决常见安装问题以下是新手常遇到的问题及解决方案pip安装超时使用国内镜像源加速pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple权限问题避免使用sudo推荐使用--user参数pip install --user package_name环境变量不生效确保使用的是zsh而非bashmacOS Catalina及以后版本默认使用zsh2. LangChain核心组件安装与配置2.1 安装LangChain与ChromaDBLangChain是一个用于构建AI应用的框架而ChromaDB是一个轻量级的向量数据库。安装命令如下pip install langchain chromadb安装过程中可能会遇到以下依赖项hnswlib用于高效相似性搜索的库sentence-transformers文本嵌入模型tiktokenOpenAI的tokenizer注意如果遇到hnswlib编译错误可以设置环境变量export HNSWLIB_NO_NATIVE12.2 验证安装创建一个简单的Python脚本验证安装是否成功import langchain import chromadb print(LangChain版本:, langchain.__version__) print(ChromaDB版本:, chromadb.__version__)运行脚本python verify_install.py2.3 可选组件安装根据你的需求可能还需要安装以下组件pip install openai tiktoken sentence-transformers3. OpenAI API配置与集成3.1 获取OpenAI API密钥访问 OpenAI官网并登录点击右上角头像 → View API keys点击Create new secret key生成API密钥3.2 安全存储API密钥不建议将API密钥硬编码在脚本中。推荐使用环境变量echo export OPENAI_API_KEYyour-api-key-here ~/.zshrc source ~/.zshrc在Python中可以通过以下方式获取import os api_key os.environ[OPENAI_API_KEY]3.3 测试OpenAI连接创建一个简单的测试脚本from langchain.llms import OpenAI llm OpenAI(temperature0.9) print(llm(请用一句话解释人工智能))4. 构建第一个LangChain应用4.1 创建简单的问答系统from langchain.document_loaders import TextLoader from langchain.text_splitter import CharacterTextSplitter from langchain.embeddings.openai import OpenAIEmbeddings from langchain.vectorstores import Chroma # 加载文本文件 loader TextLoader(example.txt) documents loader.load() # 分割文本 text_splitter CharacterTextSplitter(chunk_size1000, chunk_overlap0) texts text_splitter.split_documents(documents) # 创建向量存储 embeddings OpenAIEmbeddings() vectorstore Chroma.from_documents(texts, embeddings) # 查询 query 文章主要讲了什么 docs vectorstore.similarity_search(query) print(docs[0].page_content)4.2 持久化向量数据库将向量数据库保存到磁盘以便后续使用# 保存 vectorstore.persist() # 加载 loaded_vectorstore Chroma(persist_directorychroma_storage, embedding_functionembeddings)4.3 完整问答系统示例from langchain.chains import RetrievalQA from langchain.llms import OpenAI qa RetrievalQA.from_chain_type( llmOpenAI(), chain_typestuff, retrievervectorstore.as_retriever() ) result qa.run(根据文章内容作者的主要观点是什么) print(result)5. 高级配置与优化技巧5.1 性能优化批量处理减少API调用次数缓存使用LangChain的缓存功能from langchain.cache import InMemoryCache from langchain.llms import OpenAI llm OpenAI() llm.cache InMemoryCache()5.2 错误处理from openai.error import RateLimitError import time def safe_llm_call(prompt): try: return llm(prompt) except RateLimitError: print(达到速率限制等待60秒...) time.sleep(60) return safe_llm_call(prompt)5.3 使用更高效的嵌入模型from langchain.embeddings import HuggingFaceEmbeddings embeddings HuggingFaceEmbeddings(model_nameall-MiniLM-L6-v2)6. 实际项目结构建议一个良好的项目结构能大大提高开发效率my_langchain_project/ ├── data/ # 原始数据文件 │ └── documents/ ├── chroma_storage/ # 向量数据库存储 ├── config/ # 配置文件 │ └── settings.py ├── src/ # 源代码 │ ├── loaders/ # 自定义文档加载器 │ ├── chains/ # 自定义链 │ └── main.py ├── requirements.txt # 依赖项 └── README.md在开发过程中我发现最实用的调试技巧是在关键步骤添加日志记录import logging logging.basicConfig(levellogging.INFO) logger logging.getLogger(__name__) logger.info(正在加载文档...)

AI驱动的自适应恶意软件：从环境感知到行为决策的防御新挑战

1. 威胁的轮廓：当恶意软件学会“思考”2026年的网络安全战场，正在经历一场静默但根本性的变革。过去，我们习惯于将恶意软件视为一种“武器化”的静态程序——它被制造出来，被投递，然后按照预设的脚本执行其破坏任务。我…

2026/5/30 6:14:04 阅读更多

突破LLM上下文限制：基于自我摘要的记忆系统设计与实现

1. 项目概述：当AI学会“记笔记” 最近在跟进大语言模型（LLM）应用落地的项目时，一个核心痛点反复出现：模型在处理长文本或多轮对话时，经常“前言不搭后语”，记不住几分钟前自己说过的话。这就像让…

2026/5/30 6:13:03 阅读更多

【GitHub项目推荐--RedditVideoMakerBot：一键生成 TikTok 爆款视频的编程魔法】⭐

GitHub 地址：https://github.com/elebumm/RedditVideoMakerBot 简介 RedditVideoMakerBot 是由 Lewis Menelaws 和 TMRRW 开发的开源 Python 项目，它通过全自动化的“编程魔法”，将 Reddit 上的热门帖子（如 r/AskReddit 的问答…

2026/5/30 6:12:23 阅读更多

保姆级教程：PA100K行人属性数据集下载与MAT标注文件解析（附Python转换脚本）

PA100K行人属性数据集实战指南：从下载到结构化处理全流程解析行人属性识别作为计算机视觉领域的重要研究方向，在智能安防、零售分析等场景中具有广泛应用价值。而PA100K作为当前规模最大的公开行人属性数据集，包含10万张标注图像和26种属性…

2026/5/30 8:30:53 阅读更多

手把手教你：在Ubuntu 22.04上挂载VMFS6数据存储（附vmfs6-tools安装避坑指南）

在Ubuntu 22.04上安全访问VMFS6存储的完整实践指南当企业IT环境中同时存在VMware虚拟化平台和物理Linux服务器时，经常需要在非虚拟化环境中直接访问VMFS格式的存储数据。本文将详细介绍如何在Ubuntu 22.04 LTS系统上，通过vmfs6-tools工具集安全地挂载和操…

2026/5/30 8:30:53 阅读更多

告别动态字体坑：手把手教你为Unity TextMeshPro生成一个‘够用’的静态中文字体资源

告别动态字体坑：手把手教你为Unity TextMeshPro生成一个‘够用’的静态中文字体资源在Unity UI开发中，TextMeshPro（TMP）无疑是处理文本渲染的黄金标准。但许多开发者第一次接触中文字体支持时，往往会遇到一个令人抓狂的…

2026/5/30 8:30:13 阅读更多

别只看FPS了！Unity Game视图Stats面板全解读，从‘Batches’到‘Tris’的优化指南

别只看FPS了！Unity Game视图Stats面板全解读，从‘Batches’到‘Tris’的优化指南在Unity开发中，性能优化是永恒的话题。很多开发者习惯性地盯着FPS数值，却忽略了Game视图Stats面板中隐藏的更多关键信息。这些数据就像游戏性能的&q…

2026/5/30 8:30:13 阅读更多

STM 32 TIM定时器（1）

基础计时器控制LED灯定时熄灭开启设置分频器计时频率为F72Mhz/72001X10^410000 这样一次计数就是0.1ms，方便计算设置ARRARR设置为1000，这样计时器1000次进行重装载，也就是0.1msX1000100ms进行重装载关于为什么需要减1，那是因为在更…

2026/5/30 8:29:53 阅读更多

Windows右键菜单终极清理指南：ContextMenuManager让你的电脑操作效率翻倍 [特殊字符]

Windows右键菜单终极清理指南：ContextMenuManager让你的电脑操作效率翻倍 🚀 【免费下载链接】ContextMenuManager 🖱️ 纯粹的Windows右键菜单管理程序项目地址: https://gitcode.com/gh_mirrors/co/ContextMenuManager 你是否曾经在…

2026/5/30 8:29:12 阅读更多

Win11/Win10深度学习环境搭建：实测PyCharm远程连接WSL2下的CUDA，性能比虚拟机强多少？

Win11/Win10深度学习环境终极对决：WSL2 CUDA vs 虚拟机 vs 双系统实测指南当开发者需要在Windows系统上进行深度学习开发时，通常会面临三种选择：虚拟机方案、双系统方案和WSL2方案。本文将基于实际测试数据，从GPU性能、开发便利性…

2026/5/30 0:00:39 阅读更多

SketchUp STL插件终极指南：3D打印工作流完全掌握

SketchUp STL插件终极指南：3D打印工作流完全掌握【免费下载链接】sketchup-stl A SketchUp Ruby Extension that adds STL (STereoLithography) file format import and export. 项目地址: https://gitcode.com/gh_mirrors/sk/sketchup-stl SketchUp STL插件…

2026/5/30 0:00:39 阅读更多

基于ICL8038的多波形信号发生器：从原理到制作的完整指南

1. 项目概述：从零构建一个基于ICL8038的多波形信号发生器在电子实验、设备调试乃至生物医学信号处理领域，一个稳定可靠、波形纯净的信号源是不可或缺的“心脏”。无论是用于测试放大器的频率响应，还是模拟生理电信号进行算法研究，…

2026/5/30 0:01:40 阅读更多

施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录

更多请点击： https://codechina.net 第一章：施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录在华北某大型地铁盾构施工现场，一套轻量化AI Agent系统于2024年Q2完成全栈部署&#xff…

2026/5/29 8:13:02 阅读更多

附录 B：术语表

本术语表面向“从 MM 到 HMM”专栏阅读过程中的快速查阅。它不是内核 API 手册，而是把文章中反复出现的概念放到同一张地图上：先给出直观含义，再说明它在 Linux MM/HMM 语境里的作用。建议阅读方式： 初读专栏时，把它当…

2026/5/29 8:13:55 阅读更多

Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表·行业首曝）

更多请点击： https://kaifayun.com 第一章：Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表行业首曝） Midjourney 的渐变美学并非传统插值实现，而是由其隐式神经渲染器（Implicit Neu…

2026/5/29 8:13:54 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/30 3:46:38 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/30 3:48:20 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/29 13:19:05 阅读更多

相关文章