Python音频处理librosa

发布时间：2026/5/31 7:04:57

Python librosa 音频处理详解包含音频加载、梅尔频谱图、STFT、MFCC 特征、音高检测、音频可视化import librosaimport librosa.displayimport numpy as npimport matplotlib.pyplot as pltdef generate_test_tone(duration3.0, sr22050):生成一个测试音频信号包含两个不同频率的正弦波t np.linspace(0, duration, int(sr * duration), endpointFalse)# 440HzA4 音和 880HzA5 音的混合带淡入淡出tone1 0.5 * np.sin(2 * np.pi * 440 * t)tone2 0.3 * np.sin(2 * np.pi * 880 * t)signal tone1 tone2# 应用淡入淡出包络避免点击声fade_len int(sr * 0.05)fade_in np.linspace(0, 1, fade_len)fade_out np.linspace(1, 0, fade_len)signal[:fade_len] * fade_insignal[-fade_len:] * fade_outreturn signal, srdef plot_audio_features(y, sr, save_nameaudio_features.png):绘制音频的各种特征图plt.figure(figsize(14, 10))# 子图 1原始波形plt.subplot(4, 2, 1)librosa.display.waveshow(y, srsr)plt.title(波形图 (Waveform))plt.xlabel(时间 (秒)), plt.ylabel(振幅)# 子图 2短时傅里叶变换 (STFT) 频谱图plt.subplot(4, 2, 2)D librosa.stft(y) # STFT 返回复数矩阵# 将复数振幅转为分贝刻度视觉上更清晰D_db librosa.amplitude_to_db(np.abs(D), refnp.max)librosa.display.specshow(D_db, srsr, x_axistime, y_axishz)plt.title(STFT 频谱图 (Spectrogram))plt.colorbar(format%2.0f dB)# 子图 3梅尔频谱图模拟人耳感知plt.subplot(4, 2, 3)mel_spec librosa.feature.melspectrogram(yy, srsr, n_mels128)mel_db librosa.power_to_db(mel_spec, refnp.max)librosa.display.specshow(mel_db, srsr, x_axistime,y_axismel, fmax8000)plt.title(梅尔频谱图 (Mel Spectrogram))plt.colorbar(format%2.0f dB)# 子图 4MFCC 特征梅尔频率倒谱系数plt.subplot(4, 2, 4)mfcc librosa.feature.mfcc(yy, srsr, n_mfcc13)librosa.display.specshow(mfcc, srsr, x_axistime)plt.title(MFCC 特征 (13 维))plt.colorbar()# 子图 5色度特征Chroma12 个音级类别plt.subplot(4, 2, 5)chroma librosa.feature.chroma_stft(yy, srsr, n_chroma12)librosa.display.specshow(chroma, srsr, x_axistime, y_axischroma)plt.title(色度特征 (Chroma))plt.colorbar()# 子图 6谱质心Spectral Centroid—— 音色明亮度plt.subplot(4, 2, 6)cent librosa.feature.spectral_centroid(yy, srsr)times librosa.times_like(cent, srsr)plt.semilogy(times, cent.T, label谱质心, colorb)plt.ylabel(频率 (Hz)), plt.xlabel(时间 (秒))plt.title(谱质心 (Spectral Centroid))plt.grid(True)# 子图 7零交叉率Zero-Crossing Rateplt.subplot(4, 2, 7)zcr librosa.feature.zero_crossing_rate(y)plt.plot(librosa.times_like(zcr, srsr), zcr.T, colorg)plt.title(零交叉率 (ZCR))plt.xlabel(时间 (秒)), plt.ylabel(ZCR)plt.grid(True)# 子图 8RMS 能量Root Mean Square Energyplt.subplot(4, 2, 8)rms librosa.feature.rms(yy)plt.plot(librosa.times_like(rms, srsr), rms.T, colorr)plt.title(RMS 能量 (RMS Energy))plt.xlabel(时间 (秒)), plt.ylabel(RMS)plt.grid(True)plt.tight_layout()plt.savefig(save_name, dpi150)plt.show()# 1. 加载音频文件 # 尝试加载外部音频文件若失败则使用生成的测试信号audio_path input_audio.wavtry:y, sr librosa.load(audio_path, srNone)print(f加载音频: {audio_path}, 采样率{sr}Hz, 时长{len(y)/sr:.2f}s)except Exception:print(f文件 {audio_path} 不存在使用生成的测试音调。)y, sr generate_test_tone(duration3.0)print(f生成测试音频: 采样率{sr}Hz, 时长{len(y)/sr:.2f}s)# 2. 时域分析波形和过零率 print(f音频基本信息: 采样点数{len(y)}, 采样率{sr}Hz)print(f振幅范围: [{y.min():.4f}, {y.max():.4f}])# 3. 频域分析STFT 和频谱 # STFT 参数fft 窗口2048hop 长度512窗口类型汉宁窗D librosa.stft(y, n_fft2048, hop_length512, win_length2048)magnitude np.abs(D) # 幅度谱phase np.angle(D) # 相位谱print(fSTFT 矩阵形状: {D.shape} (频率 bins x 时间帧数))# 4. 梅尔频谱图 mel librosa.feature.melspectrogram(yy, srsr, n_mels128)mel_db librosa.power_to_db(mel, refnp.max)print(f梅尔频谱形状: {mel.shape})# 5. MFCC 特征提取 # MFCC 是语音识别中最常用的特征模拟人耳听觉特性mfcc librosa.feature.mfcc(yy, srsr, n_mfcc13, n_fft2048, hop_length512)mfcc_delta librosa.feature.delta(mfcc) # 一阶差分速度mfcc_delta2 librosa.feature.delta(mfcc, order2) # 二阶差分加速度print(fMFCC 形状: {mfcc.shape})print(fMFCC 均值: {mfcc.mean(axis1)})# 6. 音高检测基频估计 # 使用自相关法pyin 算法估计基频 F0f0, voiced_flag, voiced_probs librosa.pyin(y, fminlibrosa.note_to_hz(C2), # 最低 65Hzfmaxlibrosa.note_to_hz(C7), # 最高 2093Hzsrsr)# 将 NaN无声部分填充为 0f0 np.nan_to_num(f0)valid_pitches f0[f0 0]if len(valid_pitches) 0:print(f检测到音高范围: {valid_pitches.min():.1f}Hz ~ f{valid_pitches.max():.1f}Hz)# 将频率转为 MIDI 音符编号midi_notes librosa.hz_to_midi(valid_pitches)note_names [librosa.midi_to_note(int(n)) for n in midi_notes[:10]]print(f前 10 个有效音高的音符: {note_names})# 7. 节拍跟踪 tempo, beats librosa.beat.beat_track(yy, srsr)print(f估计速度: {tempo:.1f} BPM)if len(beats) 0:beat_times librosa.frames_to_time(beats, srsr)print(f检测到 {len(beats)} 个节拍位置)# 8. 绘制所有音频特征 plot_audio_features(y, sr)print(librosa 音频处理演示完成涵盖时域/频域/MFCC/音高/节拍分析。)

到底为什么要有操作系统进程模型？

它的本质是：**进程（Process）是操作系统为了管理混乱的物理硬件，而创造出的一个逻辑容器 (Logical Container)。它将 CPU、内存、I/O 等物理资源封装成一个独立的、受保护的、可调度的执行单元。没有进程的世界：所有…

2026/5/31 7:03:15 阅读更多

用位图索引加速 Harness 的标签筛选

从秒级到毫秒级：用位图索引重构Harness标签筛选引擎副标题：详解低基数数据下的索引优化策略与工程实践第一部分：引言与基础 (Introduction & Foundation) 1. 引人注目的标题 (Compelling Title) 正如主标题所示，本文将聚焦于…

2026/5/31 7:01:14 阅读更多

PyTorch动态计算图与张量思维：从深度学习框架到工程师核心能力重塑

1. 从框架到思维：为什么PyTorch不止是工具最近和几个不同技术栈的工程师朋友聊天，发现一个挺有意思的现象：那些深度用过PyTorch的工程师，在讨论技术方案、排查问题，甚至是设计系统架构时，思考问题的角度和深…

2026/5/31 6:59:53 阅读更多

从EXT4到Btrfs：我的Linux家用服务器文件系统升级踩坑实录

从EXT4到Btrfs：我的Linux家用服务器文件系统升级踩坑实录去年冬天，当我发现家用NAS上的照片库因磁盘静默错误损坏了三个重要文件夹时，终于下定决心告别陪伴我七年的EXT4文件系统。作为一位长期使用Debian系发行版的技术爱好者，这次…

2026/5/31 8:03:00 阅读更多

AzurLaneAutoScript：碧蓝航线自动化脚本终极指南

AzurLaneAutoScript：碧蓝航线自动化脚本终极指南【免费下载链接】AzurLaneAutoScript Azur Lane bot (CN/EN/JP/TW) 碧蓝航线脚本 | 无缝委托科研，全自动大世界项目地址: https://gitcode.com/gh_mirrors/az/AzurLaneAutoScript 还在为碧蓝航线…

2026/5/31 8:03:00 阅读更多

炉石传说HsMod插件：50+功能让游戏体验翻倍的终极指南

炉石传说HsMod插件：50功能让游戏体验翻倍的终极指南【免费下载链接】HsMod Hearthstone Modification Based on BepInEx 项目地址: https://gitcode.com/GitHub_Trending/hs/HsMod 还在为炉石传说中繁琐的开包动画烦恼吗？还在为无法自定义界面而…

2026/5/31 8:03:00 阅读更多

图解Linux V4L2异步注册：从设备树到驱动加载，保姆级拆解v4l2_async_subdev_notifier_register

深度解析Linux V4L2异步注册机制：从设备树到驱动加载全流程在嵌入式Linux开发中，Camera模组的集成往往是最具挑战性的任务之一。当工程师面对一块全新的Camera模组时，如何将其驱动无缝集成到现有BSP中？V4L2框架的异步注册机制正是…

2026/5/31 8:01:40 阅读更多

Multi-Agent商业化机会：数据服务模式的价值挖掘与变现

Multi-Agent商业化机会：数据服务模式的价值挖掘与变现一、引言钩子想象一下这样的场景：你是一家连锁生鲜电商的运营总监，周一早上9点刚打开电脑，办公桌上就“自动”摆好了三份完整的日报——一份由供应链Agent整理的生鲜损耗溯…

2026/5/31 8:01:20 阅读更多

百度网盘直链解析：3分钟实现满速下载的终极免费方案

百度网盘直链解析：3分钟实现满速下载的终极免费方案【免费下载链接】baidu-wangpan-parse 获取百度网盘分享文件的下载地址项目地址: https://gitcode.com/gh_mirrors/ba/baidu-wangpan-parse 还在为百度网盘的非会员限速而烦恼吗？今天我要为你…

2026/5/31 8:00:59 阅读更多

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

Realtek 8188GU网卡驱动故障深度修复指南：从原理到实战当设备管理器里那个顽固的黄色感叹号挥之不去，而你已经尝试了所有"标准操作"——Windows自动更新、第三方驱动工具、甚至重启大法——却依然无济于事时，是时候换个思路了。这篇…

2026/5/31 0:02:08 阅读更多

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

AnolisOS 8.8安装源配置实战指南：从诊断到解决方案的全流程解析当你在安装AnolisOS 8.8时遇到"设置基础软件仓库时出错"的提示，这通常意味着系统无法访问或识别安装源。这个问题看似简单，但背后可能涉及网络配置、镜像选择、启动参…

2026/5/31 0:02:08 阅读更多

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

1. 项目概述与核心思路最近在整理工作室的电子元件，翻出来几个闲置的街机按钮和一块树莓派Pico，灵机一动，决定做个简单又有趣的反应速度测试游戏。这个项目非常适合想入门嵌入式开发的朋友，它不涉及复杂的传感器和通信协议&#x…

2026/5/31 0:03:49 阅读更多

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

2026/5/31 0:02:08 阅读更多

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

2026/5/31 0:02:08 阅读更多

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

2026/5/31 0:03:49 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/30 3:46:38 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/30 3:48:20 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/30 22:39:05 阅读更多

相关文章

到底为什么要有操作系统进程模型 ？

用位图索引加速 Harness 的标签筛选

PyTorch动态计算图与张量思维：从深度学习框架到工程师核心能力重塑

从EXT4到Btrfs：我的Linux家用服务器文件系统升级踩坑实录

AzurLaneAutoScript：碧蓝航线自动化脚本终极指南

炉石传说HsMod插件：50+功能让游戏体验翻倍的终极指南

图解Linux V4L2异步注册：从设备树到驱动加载，保姆级拆解v4l2_async_subdev_notifier_register

Multi-Agent商业化机会：数据服务模式的价值挖掘与变现

百度网盘直链解析：3分钟实现满速下载的终极免费方案

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

到底为什么要有操作系统进程模型？