【observability】【observability06】使用PostHog和Langfuse分析和调试LlamaIndex应用程序

发布时间：2026/6/8 3:23:01

1. 案例概述本案例展示了如何使用LlamaIndex构建一个RAG检索增强生成应用程序使用Langfuse追踪操作步骤并在PostHog中分析数据。具体来说我们将创建一个关于刺猬护理的聊天应用程序使用Mistral模型处理查询并通过Langfuse和PostHog进行监控和分析。关键组件介绍LangfuseLangfuse是一个开源的LLM工程平台旨在帮助工程师理解和优化用户与语言模型应用的交互。它提供跟踪、调试和改进LLM性能的工具可用于真实世界的用例。Langfuse提供托管云解决方案和本地或自托管部署选项。PostHogPostHog是一个流行的产品分析选择。将Langfuse的LLM分析与PostHog的产品分析相结合可以轻松实现分析用户参与度确定用户与特定LLM功能的交互频率了解他们的整体活动模式关联反馈与行为查看在Langfuse中捕获的用户反馈如何与PostHog中的用户行为相关联监控LLM性能跟踪和分析模型成本、延迟和用户反馈等指标以优化LLM性能LlamaIndexLlamaIndex是一个数据框架旨在将LLM与外部数据源连接。它帮助有效地结构化、索引和查询数据使开发人员更容易构建高级LLM应用程序。2. 技术栈与核心依赖核心依赖库llama-index- LlamaIndex核心库用于构建RAG应用llama-index-llms-mistralai- Mistral AI模型集成llama-index-embeddings-mistralai- Mistral AI嵌入模型集成langfuse- Langfuse客户端用于LLM追踪和分析openinference-instrumentation-llama-index- OpenInference LlamaIndex工具用于自动捕获操作wget- 用于下载数据文件nest_asyncio- 允许同步和异步代码一起使用注意本示例需要Mistral API密钥和Langfuse API密钥才能正常运行。3. 环境配置步骤1安装依赖%pip install llama-index llama-index-llms-mistralai llama-index-embeddings-mistralai nest_asyncio --upgrade %pip install langfuse openinference-instrumentation-llama-index wget步骤2配置API密钥import os # 设置Mistral API密钥 os.environ[MISTRAL_API_KEY] *** # 设置Langfuse API密钥 os.environ[LANGFUSE_PUBLIC_KEY] pk-lf-... os.environ[LANGFUSE_SECRET_KEY] sk-lf-... os.environ[LANGFUSE_HOST] https://cloud.langfuse.com # 欧洲区域 # os.environ[LANGFUSE_HOST] https://us.cloud.langfuse.com # 美国区域步骤3导入必要的库# 确保同步和异步代码可以一起使用 import nest_asyncio nest_asyncio.apply() # 导入并设置LlamaIndex from llama_index.llms.mistralai import MistralAI from llama_index.embeddings.mistralai import MistralAIEmbedding from llama_index.core import Settings # 导入Langfuse相关库 from langfuse import get_client, observe from openinference.instrumentation.llama_index import LlamaIndexInstrumentor # 其他工具 import wget from llama_index.core import SimpleDirectoryReader, VectorStoreIndex4. 案例实现步骤1设置LlamaIndex和Mistral# 定义LLM和嵌入模型 llm MistralAI(modelopen-mixtral-8x22b, temperature0.1) embed_model MistralAIEmbedding(model_namemistral-embed) # 在Settings对象中设置LLM和嵌入模型 Settings.llm llm Settings.embed_model embed_model这里我们使用Mistral的open-mixtral-8x22b模型作为语言模型mistral-embed作为嵌入模型并将它们设置为LlamaIndex的全局默认设置。步骤2初始化Langfusefrom langfuse import get_client langfuse get_client() # 验证连接 if langfuse.auth_check(): print(Langfuse客户端已认证并准备就绪) else: print(认证失败。请检查您的凭据和主机。) # 初始化LlamaIndex工具 LlamaIndexInstrumentor().instrument()我们初始化Langfuse客户端并验证连接然后使用OpenInference LlamaIndex工具自动捕获LlamaIndex操作并将OpenTelemetry (OTel) spans导出到Langfuse。步骤3下载数据import wget # 下载刺猬护理指南PDF url https://www.pro-igel.de/downloads/merkblaetter_engl/wildtier_engl.pdf wget.download(url, ./hedgehog.pdf) # 使用LlamaIndex SimpleDirectoryReader加载PDF hedgehog_docs SimpleDirectoryReader( input_files[./hedgehog.pdf] ).load_data()我们下载一个关于刺猬护理的PDF文件并使用LlamaIndex的SimpleDirectoryReader加载它作为我们RAG应用的数据源。步骤4构建刺猬文档的RAGfrom llama_index.core import VectorStoreIndex # 创建向量索引 hedgehog_index VectorStoreIndex.from_documents(hedgehog_docs) # 创建可查询引擎 hedgehog_query_engine hedgehog_index.as_query_engine(similarity_top_k5) # 查询引擎并打印响应 response hedgehog_query_engine.query(哪些刺猬需要帮助) print(response)我们使用VectorStoreIndex创建刺猬文档的向量嵌入然后将其转换为可查询引擎以便基于查询检索信息。步骤5实现用户反馈可选observe() def hedgehog_helper(user_message): response hedgehog_query_engine.query(user_message) trace_id langfuse.get_current_trace_id() print(response) return trace_id # 调用函数并获取trace_id trace_id hedgehog_helper(我可以把刺猬当作宠物养吗) # 为trace评分例如添加用户反馈 langfuse.create_score( trace_idtrace_id, nameuser-explicit-feedback, value0.9, data_typeNUMERIC, # 可选如果未提供则推断 comment很好知道, # 可选 )我们使用Langfuse的observe()装饰器自动为顶级函数创建trace为任何嵌套函数创建spans。然后使用create_score()方法存储用户反馈如赞/踩或评论这些分数可以在PostHog中进行分析。步骤6在PostHog中查看数据最后我们将PostHog连接到我们的Langfuse账户。步骤如下注册免费的PostHog账户从项目设置中复制项目API密钥和主机在Langfuse仪表板中点击设置并向下滚动到集成部分找到PostHog集成点击配置并粘贴您的PostHog主机和项目API密钥点击启用然后保存Langfuse将开始每天将您的数据导出到PostHog一次。您可以使用仪表板模板快速设置相关洞察分析模型成本、用户反馈和延迟。5. 案例效果通过本示例您可以实现以下效果全面的LLM追踪- 自动捕获LlamaIndex操作的所有步骤包括查询、嵌入、检索和生成用户反馈收集- 使用Langfuse Scores收集用户反馈如赞/踩或评论跨平台分析- 将Langfuse的LLM分析与PostHog的产品分析相结合获得更全面的洞察性能监控- 跟踪和分析模型成本、延迟和用户反馈等指标可视化仪表板- 使用PostHog的仪表板模板可视化LLM指标和用户行为集成架构本示例的集成架构如下LlamaIndex处理查询并生成响应OpenInference LlamaIndex工具自动捕获操作并导出到LangfuseLangfuse收集、存储和分析LLM数据PostHog从Langfuse导入数据提供产品分析和可视化6. 案例实现思路本案例的实现基于以下思路分层集成- 通过多个层次的集成实现端到端的可观测性LlamaIndex处理查询Langfuse捕获LLM数据PostHog提供产品分析自动化追踪- 使用OpenInference LlamaIndex工具自动捕获LlamaIndex操作无需手动添加追踪代码标准化数据模型- 使用OpenTelemetry标准确保数据的一致性和互操作性用户反馈循环- 通过Langfuse Scores收集用户反馈并在PostHog中分析形成反馈循环可视化分析- 利用PostHog的仪表板功能提供直观的数据可视化和分析这种设计使得开发者可以全面了解LLM应用的性能和用户交互从而持续改进应用质量。7. 扩展建议基于本示例您可以考虑以下扩展方向多模型比较- 扩展应用以支持多个LLM模型并在PostHog中比较它们的性能实时监控- 设置实时警报当关键指标如延迟、错误率超过阈值时通知A/B测试- 使用PostHog的A/B测试功能测试不同的提示策略或检索参数自定义评估指标- 实现自定义评估指标如响应相关性、准确性等用户细分- 在PostHog中创建用户细分分析不同用户群体的行为模式成本优化- 基于成本数据优化模型使用和查询策略8. 总结本案例展示了如何使用LlamaIndex、Langfuse和PostHog构建一个全面可观测的RAG应用程序。通过集成这三个平台我们实现了从查询处理到性能监控再到用户行为分析的完整闭环。这种多平台集成的优势在于全面的可观测性- 从技术性能到用户行为的多维度监控数据驱动的优化- 基于实际使用数据和用户反馈持续改进应用灵活的分析能力- 结合LLM专业分析和通用产品分析的优点这种方法为构建高质量、用户友好的LLM应用程序提供了强大的工具和洞察帮助开发者在复杂的LLM应用开发过程中做出明智的决策。

Nature同款 | 跟着顶刊学配色第 49 期 (附开源免费的配色网站)

在发表科研论文的过程中，制作精美的绘图能够在第一时间吸引编辑和审稿人的眼球。配色是提升绘图吸引力至关重要的一环，而提升自己配色审美最直接的方法就是跟着顶刊学习。本系列文章收集了顶刊中的绘图，并提取了颜色代码，希望能为…

2026/6/8 3:23:01 阅读更多

软件工程期末自救指南：避开这10个高频易错点，轻松拿下选择题和判断题

软件工程期末自救指南：避开这10个高频易错点，轻松拿下选择题和判断题期末考试临近，面对软件工程导论这门课程的选择题和判断题，你是否感到无从下手？选择题的选项看似都正确，判断题的描述似是而非&#xff0…

2026/6/8 3:22:21 阅读更多

Windows下 Claude 安装

windows 下安装claude前，需要先安装git与node.js环境，此处不在详细介绍安装过程，重点进行claude的安装过程说明，如下演示在windows系统下如何安装一、使用包管理安装 winget install Anthropic.ClaudeCode 安装完成&#xff0…

2026/6/8 3:22:21 阅读更多

SAP MM配置实战：手把手教你用OMS4定义物料状态，精准控制物料生命周期

SAP MM配置实战：深度解析OMS4物料状态配置与业务管控逻辑物料主数据管理是SAP系统中最基础也最关键的环节之一。在实际项目中，我们经常会遇到业务部门提出"为什么这个物料不能采购？"、"为什么系统不允许我们做生产投料&#…

2026/6/8 5:56:24 阅读更多

Matlab 2019b在Linux上安装失败？我踩过的坑和避坑指南都在这了

Matlab 2019b在Linux系统安装全攻略：从报错排查到完美运行最近在CentOS 7上部署Matlab 2019b时，我遇到了各种意想不到的问题。从挂载ISO失败到许可证验证错误，每个环节都可能成为安装路上的绊脚石。本文将分享这些实际踩坑经历和解决方案&…

2026/6/8 5:56:24 阅读更多

Microsemi Libero Soc v11.9 安装与证书获取保姆级避坑指南（Win10实测）

Microsemi Libero Soc v11.9 安装与证书获取实战避坑手册作为一名FPGA开发者，第一次接触Microsemi Libero Soc的安装过程往往充满挑战。不同于常规软件的"下一步"式安装，Libero Soc从下载到证书获取的每个环节都可能成为新手的技术路障。本文将…

2026/6/8 5:55:24 阅读更多

AI自由意志的工程化实现：可测量、可干预、可重构的自主性设计

1. 这不是哲学课，而是一场关于“人如何定义自己”的实操讨论“Artificial Intelligence and Free Will”——这个标题常被误读为一场纯思辨的哲学讲座，或是科幻小说的序章。但在我过去十二年接触过372个AI系统落地项目、参与过14轮人机协作伦理评估、亲手…

2026/6/8 5:55:04 阅读更多

MuleSoft+LangChain企业AI编排实战：构建可审计的AI交响指挥家

1. 项目概述：当企业数据孤岛撞上大模型洪流，我们真正需要的不是更多AI，而是“AI交响指挥家”你有没有遇到过这样的场景：销售总监在晨会上拍着桌子问，“为什么CRM里看不到客户最近三次支持工单的情绪倾向？为…

2026/6/8 5:54:44 阅读更多

拯救你的学术写作：用Grammarly和Overleaf插件自动检查论文语法与格式

学术写作效率革命：用智能工具构建零差错论文工作流第一次投稿被拒时，编辑反馈信里那句"请彻底检查基本语法和格式错误"让我盯着屏幕发呆了半小时——这些看似简单的空格、标点、大小写问题，消耗了研究者们平均27%的修订时间。更令人…

2026/6/8 5:54:03 阅读更多

解决老旧机顶盒资源化难题：Amlogic S9xxx Armbian项目在TY1608设备上的系统适配实现

解决老旧机顶盒资源化难题：Amlogic S9xxx Armbian项目在TY1608设备上的系统适配实现【免费下载链接】amlogic-s9xxx-armbian Supports running Armbian on Amlogic, Allwinner, and Rockchip devices. Support a311d, s922x, s905x3, s905x2, s912, s905d, s905x, …

2026/6/8 0:00:25 阅读更多

Python Scrapy 爬虫实战进阶系列（一）：轻量化数据存储 - 数据精准写入 SQLite 数据库

前言在 Python 爬虫开发领域中，Scrapy 作为高性能、高可扩展性的异步爬虫框架，是行业内采集结构化数据的首选工具。在中小型爬虫项目、本地数据采集、轻量化数据存储场景中，SQLite 无需独立服务、单文件存储、原生兼容 Python 的特性&#…

2026/6/8 0:00:45 阅读更多

3步实现Windows直读Btrfs分区：跨平台文件系统互通终极方案

3步实现Windows直读Btrfs分区：跨平台文件系统互通终极方案【免费下载链接】btrfs WinBtrfs - an open-source btrfs driver for Windows 项目地址: https://gitcode.com/gh_mirrors/bt/btrfs 还在为Windows无法访问Linux Btrfs分区而烦恼吗？你是…

2026/6/8 0:03:08 阅读更多

LED驱动技术全解析：从核心架构到实战选型与避坑指南

1. 从一颗灯珠到千亿市场：LED驱动的技术演进与商业逻辑十几年前，当我第一次从料盘上拿起一颗0603封装的白色LED时，它微弱的光晕和高达几块钱的单颗成本，让我很难想象今天它几乎照亮了我们生活的每一个角落。从手机屏幕的一抹背光&…

2026/6/8 0:06:11 阅读更多

索引堆及其优化

索引堆及其优化引言索引堆是一种数据结构，广泛应用于计算机科学和软件工程领域。它主要用于解决优先队列问题，如最小堆和最大堆。本文将详细介绍索引堆的概念、实现方法以及优化策略。索引堆的定义索引堆是一种基于堆数据结构的索引机制。它通过维护一个堆来存储数据…

2026/6/8 0:06:11 阅读更多

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

更多请点击： https://intelliparadigm.com 第一章：CSDN AI 数字营销的官方引流卡片是什么功能？ CSDN AI 数字营销平台推出的「官方引流卡片」，是一种面向技术创作者的轻量级、可嵌入式内容分发组件，专为提升博文、教程…

2026/6/8 0:06:11 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/7 9:41:13 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/7 9:41:15 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/7 9:41:13 阅读更多

相关文章

Nature同款 | 跟着顶刊学配色第 49 期 (附开源免费的配色网站)

软件工程期末自救指南：避开这10个高频易错点，轻松拿下选择题和判断题

Windows下 Claude 安装

SAP MM配置实战：手把手教你用OMS4定义物料状态，精准控制物料生命周期

Matlab 2019b在Linux上安装失败？我踩过的坑和避坑指南都在这了

Microsemi Libero Soc v11.9 安装与证书获取保姆级避坑指南（Win10实测）

AI自由意志的工程化实现：可测量、可干预、可重构的自主性设计

MuleSoft+LangChain企业AI编排实战：构建可审计的AI交响指挥家

拯救你的学术写作：用Grammarly和Overleaf插件自动检查论文语法与格式

解决老旧机顶盒资源化难题：Amlogic S9xxx Armbian项目在TY1608设备上的系统适配实现

Python Scrapy 爬虫实战进阶系列（一）：轻量化数据存储 - 数据精准写入 SQLite 数据库

3步实现Windows直读Btrfs分区：跨平台文件系统互通终极方案

LED驱动技术全解析：从核心架构到实战选型与避坑指南

索引堆及其优化

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因