用Python和Librosa库，5分钟搞定音频频率分析（附完整代码和音高对照表）

发布时间：2026/6/7 4:50:44

用Python和Librosa库快速实现音频频率分析与音高识别实战指南你是否曾经好奇一段旋律中隐藏着怎样的频率秘密当吉他手弹奏出一个和弦时如何准确知道每个音符对应的音高在音乐制作、语音分析甚至乐器调音等场景中快速准确地分析音频频率并映射到具体音高是一项极具实用价值的技能。本文将带你用Python生态中最强大的音频处理库Librosa在短短几分钟内完成从音频文件到音高识别的完整流程。1. 环境准备与Librosa库安装工欲善其事必先利其器。我们需要先搭建好Python环境并安装必要的库。Librosa是一个专门为音乐和音频分析设计的Python包它提供了丰富的信号处理功能和简洁的API接口。首先确保你已经安装了Python 3.6或更高版本。然后通过pip安装Librosa及其依赖库pip install librosa numpy matplotlib注意Librosa在处理音频文件时依赖ffmpeg如果遇到相关错误可能需要额外安装ffmpeg。在Ubuntu上可以通过sudo apt-get install ffmpeg安装Mac用户可以使用brew install ffmpeg。安装完成后我们可以通过以下代码验证安装是否成功import librosa print(Librosa版本:, librosa.__version__)这个强大的音频处理库将为我们提供以下核心功能音频文件加载与重采样频谱特征提取节拍与节奏分析音高与音色检测2. 音频文件加载与预处理实际工作中我们可能遇到各种格式的音频文件。Librosa支持WAV、MP3等常见格式能够自动处理采样率和位深度等细节。让我们从一个简单的WAV文件开始import librosa import librosa.display import matplotlib.pyplot as plt # 加载音频文件 audio_path your_audio.wav y, sr librosa.load(audio_path, srNone) # srNone保持原始采样率 print(f音频时长: {len(y)/sr:.2f}秒) print(f采样率: {sr}Hz)音频加载后我们通常需要进行一些预处理以提高分析准确性。常见的预处理步骤包括重采样统一不同音频的采样率归一化将振幅缩放到统一范围静音去除消除无声音段分帧处理将连续音频切分为短时帧以下是一个完整的预处理示例# 统一重采样到22050Hz TARGET_SR 22050 y_resampled librosa.resample(y, orig_srsr, target_srTARGET_SR) # 振幅归一化 y_normalized librosa.util.normalize(y_resampled) # 可视化原始波形 plt.figure(figsize(14, 5)) librosa.display.waveshow(y_normalized, srTARGET_SR) plt.title(归一化后的音频波形) plt.xlabel(时间(秒)) plt.ylabel(振幅) plt.show()3. 频谱分析与基频提取要确定音频的主频率我们需要将时域信号转换到频域。短时傅里叶变换(STFT)是这一过程的核心技术。Librosa提供了简便的函数来计算频谱# 计算短时傅里叶变换 D librosa.stft(y_normalized) # 将幅度谱转换为dB单位 S_db librosa.amplitude_to_db(abs(D), refnp.max) # 可视化频谱图 plt.figure(figsize(14, 5)) librosa.display.specshow(S_db, srTARGET_SR, x_axistime, y_axislog) plt.colorbar(format%2.0f dB) plt.title(频谱图) plt.show()从频谱中提取基频Fundamental Frequency是音高识别的关键步骤。Librosa提供了多种方法来实现这一点# 使用Librosa的基频估计功能 f0, voiced_flag, voiced_probs librosa.pyin(y_normalized, fminlibrosa.note_to_hz(C2), fmaxlibrosa.note_to_hz(C7)) # 可视化基频轨迹 times librosa.times_like(f0) plt.figure(figsize(14, 5)) plt.plot(times, f0, labelf0, colorcyan, linewidth2) plt.title(基频轨迹) plt.xlabel(时间(秒)) plt.ylabel(频率(Hz)) plt.legend() plt.show()4. 频率到音高的精确映射获得基频后我们需要将其映射到音乐理论中的标准音高。西方音乐将音高分为12平均律每个八度包含12个半音。以下是一个完整的频率到音高转换函数import numpy as np def freq_to_note(freq): 将频率转换为最接近的音符名称和MIDI音高值 if freq 0: return None, None # A4(440Hz)的MIDI音高值为69 semitone 12 * np.log2(freq / 440.0) 69 semitone_rounded int(round(semitone)) # MIDI音高值范围是0-127 if semitone_rounded 0 or semitone_rounded 127: return None, None # 音符名称映射 note_names [C, C#, D, D#, E, F, F#, G, G#, A, A#, B] octave semitone_rounded // 12 - 1 note_index semitone_rounded % 12 note_name f{note_names[note_index]}{octave} return note_name, semitone_rounded # 示例将提取的基频转换为音符 for frequency in f0: if frequency 0: # 过滤无效值 note, midi_num freq_to_note(frequency) if note: print(f频率{frequency:.2f}Hz - 音符{note} (MIDI:{midi_num}))为了更方便地使用我们可以创建一个完整的音高对照表MIDI编号音符名称频率(Hz)MIDI编号音符名称频率(Hz)60C4261.6372C5523.2561C#4277.1873C#5554.3762D4293.6674D5587.3363D#4311.1375D#5622.2564E4329.6376E5659.2665F4349.2377F5698.4666F#4369.9978F#5739.9967G4392.0079G5783.9968G#4415.3080G#5830.6169A4440.0081A5880.0070A#4466.1682A#5932.3371B4493.8883B5987.775. 完整工作流与实战案例现在我们将所有步骤整合成一个完整的音频分析工作流。以下代码实现了从音频文件加载到音高识别的全过程def analyze_audio_pitch(audio_path): 完整的音频频率分析和音高识别流程 # 1. 加载音频 y, sr librosa.load(audio_path, srNone) y_resampled librosa.resample(y, orig_srsr, target_sr22050) y_normalized librosa.util.normalize(y_resampled) # 2. 提取基频 f0, voiced_flag, voiced_probs librosa.pyin(y_normalized, fminlibrosa.note_to_hz(C2), fmaxlibrosa.note_to_hz(C7)) # 3. 分析结果 pitch_results [] for time, freq in zip(librosa.times_like(f0), f0): if freq 0: # 有效频率 note, midi freq_to_note(freq) if note: pitch_results.append({ time: time, frequency: freq, note: note, midi: midi }) return pitch_results # 使用示例 results analyze_audio_pitch(sample.wav) for r in results[:10]: # 打印前10个结果 print(f时间{r[time]:.2f}s: {r[frequency]:.2f}Hz - {r[note]} (MIDI:{r[midi]}))在实际应用中我们可能会遇到一些挑战和特殊情况和声分析当音频包含多个同时发声的音符时简单的基频提取可能不够噪声干扰环境噪声会影响频率检测的准确性动态音高滑音或颤音会导致频率持续变化针对这些情况我们可以采用更高级的技术# 使用谐波乘积谱提高和声分析能力 y_harmonic librosa.effects.harmonic(y_normalized) f0_harmonic librosa.yin(y_harmonic, fminlibrosa.note_to_hz(C2), fmaxlibrosa.note_to_hz(C7)) # 使用动态时间规整(DTW)分析音高变化轨迹 D librosa.stft(y_normalized) times librosa.times_like(D) frequencies librosa.fft_frequencies(srTARGET_SR)通过本教程介绍的方法你已经掌握了使用Python和Librosa库进行音频频率分析和音高识别的基本技能。这套工具在音乐信息检索(MIR)、语音处理、乐器调音等领域都有广泛应用。

51单片机教室灯光智能管理套件：带时间调度、人流量感应、光照自适应与LCD实时状态显示

本文还有配套的精品资源，点击获取简介：一套面向教学实践的51单片机照明控制硬件软件完整方案，主控兼容AT89C51/STC89C52等常见型号。内置DS1302实时时钟模块，支持精确到秒的时间设定，可按课表自动开关灯&#xff1…

2026/6/7 4:49:43 阅读更多

别只当对象存储用！用MinIO Admin命令解锁你集群的隐藏管理技能

MinIO Admin命令：解锁对象存储的隐藏管理潜能当你已经将MinIO作为对象存储解决方案部署在生产环境中，是否曾思考过它还能为你做些什么？大多数团队仅停留在基础的文件上传下载功能，却忽略了MinIO Admin命令集这座管理金矿。本文将带…

2026/6/7 4:49:43 阅读更多

Excel/VBA实战：如何用股票代码列表快速构建你的自选股监控模板

Excel/VBA实战：打造智能自选股监控模板全攻略1. 基础数据准备与清洗在开始构建自选股监控系统前，我们需要先建立规范的股票代码数据库。打开Excel新建工作簿，将"股票代码"和"股票名称"分别输入A1和B1单元格作为标题行。数…

2026/6/7 4:49:02 阅读更多

LLM实验可复现性：SageMaker Pipelines与MLflow协同实践

1. 项目概述：当大模型实验撞上工程化瓶颈，我们到底在解决什么问题？你有没有经历过这样的场景：凌晨两点，盯着 Jupyter Notebook 里第 17 个model.fit()运行日志，心里却没底——这个超参组合到底是不是最优&a…

2026/6/7 5:51:16 阅读更多

别再只会用工具了！从零理解Java反序列化漏洞的底层原理（附Demo代码调试）

从字节码到漏洞利用：Java反序列化漏洞深度解剖与防御实践在某个深夜的代码审查中，我盯着日志里突然出现的计算器窗口百思不得其解——直到发现那段被恶意构造的序列化数据。Java反序列化漏洞就像潜伏在字节流中的幽灵，当ObjectInputStream读取…

2026/6/7 5:51:16 阅读更多

有效数据清洗：面向机器学习鲁棒性的工业级实践

1. 项目概述：这不是“擦桌子”，而是给模型喂饭前的食材预处理“How to Perform Effective Data Cleaning for Machine Learning”——这个标题乍看像教科书里的章节名，但在我带过的27个工业级建模项目里，它实际是模型上线前最常被…

2026/6/7 5:50:15 阅读更多

生产级多维聚合：从pandas groupby到可解释、可监控的工程实践

1. 项目概述：为什么多维聚合不是“加个groupby”就能搞定的事我在银行数据平台组干了八年，从最早用SQL写几十行嵌套子查询做客户分层，到现在每天在Jupyter里调试pandas的agg链式调用，踩过的坑比跑过的ETL任务还多。今天这篇讲的“…

2026/6/7 5:49:35 阅读更多

AMD Ryzen系统调试终极指南：SMU Debug Tool完整使用手册

AMD Ryzen系统调试终极指南：SMU Debug Tool完整使用手册【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址: https://…

2026/6/7 5:49:14 阅读更多

Chef运维自动化入门：基础设施即代码实战指南

1. Chef 是什么？一个运维老手眼里的“服务器厨师长”你有没有试过给十台服务器装同样的软件、配同样的防火墙规则、开同样的服务端口，还要确保每台机器的时钟同步、用户权限一致、日志路径统一？我刚入行那会儿，靠手动 SSH 连一台一…

2026/6/7 5:49:14 阅读更多

LED驱动技术全解析：从核心架构到实战选型与避坑指南

1. 从一颗灯珠到千亿市场：LED驱动的技术演进与商业逻辑十几年前，当我第一次从料盘上拿起一颗0603封装的白色LED时，它微弱的光晕和高达几块钱的单颗成本，让我很难想象今天它几乎照亮了我们生活的每一个角落。从手机屏幕的一抹背光&…

2026/6/7 0:02:57 阅读更多

索引堆及其优化

索引堆及其优化引言索引堆是一种数据结构，广泛应用于计算机科学和软件工程领域。它主要用于解决优先队列问题，如最小堆和最大堆。本文将详细介绍索引堆的概念、实现方法以及优化策略。索引堆的定义索引堆是一种基于堆数据结构的索引机制。它通过维护一个堆来存储数据…

2026/6/7 0:02:57 阅读更多

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

更多请点击： https://intelliparadigm.com 第一章：CSDN AI 数字营销的官方引流卡片是什么功能？ CSDN AI 数字营销平台推出的「官方引流卡片」，是一种面向技术创作者的轻量级、可嵌入式内容分发组件，专为提升博文、教程…

2026/6/7 0:03:38 阅读更多

LED驱动技术全解析：从核心架构到实战选型与避坑指南

2026/6/7 0:02:57 阅读更多

索引堆及其优化

2026/6/7 0:02:57 阅读更多

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

2026/6/7 0:03:38 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/6 9:33:50 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/6 9:33:47 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/6 9:33:47 阅读更多

相关文章

51单片机教室灯光智能管理套件：带时间调度、人流量感应、光照自适应与LCD实时状态显示

别只当对象存储用！用MinIO Admin命令解锁你集群的隐藏管理技能

Excel/VBA实战：如何用股票代码列表快速构建你的自选股监控模板

LLM实验可复现性：SageMaker Pipelines与MLflow协同实践

别再只会用工具了！从零理解Java反序列化漏洞的底层原理（附Demo代码调试）

有效数据清洗：面向机器学习鲁棒性的工业级实践

生产级多维聚合：从pandas groupby到可解释、可监控的工程实践

AMD Ryzen系统调试终极指南：SMU Debug Tool完整使用手册

Chef运维自动化入门：基础设施即代码实战指南

LED驱动技术全解析：从核心架构到实战选型与避坑指南

索引堆及其优化

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

LED驱动技术全解析：从核心架构到实战选型与避坑指南

索引堆及其优化

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因