Ubuntu 20.04下用PortAudio库实现G1人形机器人实时喊话（附完整代码）

发布时间：2026/6/12 5:12:39

Ubuntu 20.04下用PortAudio库实现G1人形机器人实时喊话附完整代码当我们需要让机器人具备实时语音交互能力时音频采集与播放是最基础的功能之一。本文将详细介绍如何在Ubuntu 20.04系统中利用PortAudio库为G1人形机器人实现麦克风声音的实时采集与播放功能。这个方案不仅适用于远程喊话场景也可作为更复杂语音交互系统的基础模块。1. 开发环境准备在开始编码前我们需要确保开发环境已正确配置。以下是必要的准备工作系统要求Ubuntu 20.04 LTS推荐使用原生安装非虚拟机GCC 9.4.0或更高版本CMake 3.16或更高版本依赖库安装sudo apt update sudo apt install -y build-essential cmake libportaudio2 portaudio19-dev提示如果后续编译时遇到链接错误可能需要额外安装libasound2-dev包验证PortAudio安装是否成功pkg-config --modversion portaudio-2.0正常应输出类似19.6.0的版本号。2. 项目结构与CMake配置合理的项目结构能显著提高代码可维护性。建议采用如下目录布局g1_audio_project/ ├── CMakeLists.txt ├── include/ │ └── audio_utils.h ├── src/ │ ├── main.cpp │ └── audio_processor.cpp └── third_party/ └── unitree_sdk/对应的CMake配置示例cmake_minimum_required(VERSION 3.16) project(g1_realtime_audio) set(CMAKE_CXX_STANDARD 17) find_package(PkgConfig REQUIRED) pkg_check_modules(PORTAUDIO REQUIRED portaudio-2.0) include_directories( ${PORTAUDIO_INCLUDE_DIRS} ${PROJECT_SOURCE_DIR}/include ${PROJECT_SOURCE_DIR}/third_party/unitree_sdk/include ) add_executable(g1_audio src/main.cpp src/audio_processor.cpp) target_link_libraries(g1_audio ${PORTAUDIO_LIBRARIES} ${PROJECT_SOURCE_DIR}/third_party/unitree_sdk/lib/libunitree_sdk.a )3. 核心音频处理实现音频处理流程主要分为三个部分初始化、采集循环和资源释放。以下是关键代码实现3.1 音频设备初始化bool init_audio_stream(PaStream* stream, PaStreamParameters input_params) { PaError err Pa_Initialize(); if(err ! paNoError) { std::cerr PortAudio init failed: Pa_GetErrorText(err) std::endl; return false; } input_params.device Pa_GetDefaultInputDevice(); if(input_params.device paNoDevice) { std::cerr No default input device available std::endl; return false; } input_params.channelCount 1; // 单声道 input_params.sampleFormat paInt16; input_params.suggestedLatency Pa_GetDeviceInfo(input_params.device)-defaultLowInputLatency; input_params.hostApiSpecificStreamInfo nullptr; err Pa_OpenStream( stream, input_params, nullptr, // 无输出 16000, // 采样率16kHz 512, // 每帧采样数 paNoFlag, nullptr, // 无回调 nullptr ); if(err ! paNoError) { std::cerr Stream open failed: Pa_GetErrorText(err) std::endl; Pa_Terminate(); return false; } err Pa_StartStream(stream); if(err ! paNoError) { std::cerr Stream start failed: Pa_GetErrorText(err) std::endl; Pa_CloseStream(stream); Pa_Terminate(); return false; } return true; }3.2 音频采集与处理循环void audio_processing_loop(PaStream* stream, AudioClient client) { const int buffer_size 512; std::vectorint16_t audio_buffer(buffer_size); std::vectoruint8_t pcm_buffer(buffer_size * sizeof(int16_t)); std::string stream_id generate_unique_stream_id(); while(!should_stop) { PaError err Pa_ReadStream(stream, audio_buffer.data(), buffer_size); if(err ! paNoError) { std::cerr Read error: Pa_GetErrorText(err) std::endl; break; } // 转换为机器人需要的PCM格式 std::memcpy(pcm_buffer.data(), audio_buffer.data(), pcm_buffer.size()); // 发送到机器人扬声器 int ret client.PlayStream(audio_app, stream_id, pcm_buffer); if(ret ! 0) { std::cerr PlayStream failed with code: ret std::endl; } } }3.3 信号处理与资源释放volatile sig_atomic_t should_stop 0; void handle_signal(int) { should_stop 1; } void cleanup(PaStream* stream, AudioClient* client) { if(stream) { Pa_StopStream(stream); Pa_CloseStream(stream); Pa_Terminate(); } if(client) { client-PlayStop(audio_app); } }4. 性能优化与调试技巧实现基本功能后我们需要关注系统的实时性和稳定性。以下是几个关键优化点4.1 延迟优化参数调整建议参数默认值优化值影响采样率44100 Hz16000 Hz降低带宽需求帧大小1024256-512平衡延迟与CPU负载缓冲区数量23减少断流风险4.2 常见问题排查无声音输出检查默认音频设备设置pactl list short sources验证麦克风权限arecord -l测试原始采集arecord -f cd -d 5 test.wav音频卡顿# 监控CPU使用率 top -p $(pgrep -d, your_program_name) # 检查中断频率 watch -n 0.1 cat /proc/interrupts | grep timer内存泄漏检测valgrind --leak-checkfull ./g1_audio4.3 高级功能扩展回声消除实现思路// 伪代码示例 void process_echo_cancellation(int16_t* input, int16_t* output) { static WebRtcAec3 aec_processor; aec_processor.ProcessCapture(input, output); // 需要同时提供参考信号扬声器输出 aec_processor.AnalyzeRender(output); }音频压缩配置// Opus编码器示例 OpusEncoder* encoder opus_encoder_create(16000, 1, OPUS_APPLICATION_VOIP, nullptr); opus_encoder_ctl(encoder, OPUS_SET_BITRATE(16000)); opus_encoder_ctl(encoder, OPUS_SET_COMPLEXITY(8));5. 完整实现代码以下是整合所有功能的完整实现#include iostream #include vector #include cstring #include csignal #include portaudio.h #include unitree/robot/g1/audio/g1_audio_client.hpp // 全局变量 volatile sig_atomic_t g_stop_flag 0; PaStream* g_audio_stream nullptr; unitree::robot::g1::AudioClient* g_audio_client nullptr; // 信号处理 void signal_handler(int) { g_stop_flag 1; } // 初始化音频流 bool init_audio_stream() { PaError err Pa_Initialize(); if(err ! paNoError) return false; PaStreamParameters input_params; input_params.device Pa_GetDefaultInputDevice(); if(input_params.device paNoDevice) return false; input_params.channelCount 1; input_params.sampleFormat paInt16; input_params.suggestedLatency Pa_GetDeviceInfo(input_params.device)-defaultLowInputLatency; input_params.hostApiSpecificStreamInfo nullptr; err Pa_OpenStream( g_audio_stream, input_params, nullptr, 16000, 512, paNoFlag, nullptr, nullptr ); if(err ! paNoError) { Pa_Terminate(); return false; } err Pa_StartStream(g_audio_stream); if(err ! paNoError) { Pa_CloseStream(g_audio_stream); Pa_Terminate(); return false; } return true; } // 主处理循环 void run_audio_loop() { const int frame_size 512; std::vectorint16_t audio_frame(frame_size); std::vectoruint8_t pcm_data(frame_size * sizeof(int16_t)); std::string stream_id std::to_string( unitree::common::GetCurrentTimeMillisecond() ); while(!g_stop_flag) { PaError err Pa_ReadStream( g_audio_stream, audio_frame.data(), frame_size ); if(err ! paNoError) break; std::memcpy(pcm_data.data(), audio_frame.data(), pcm_data.size()); int ret g_audio_client-PlayStream( realtime_audio, stream_id, pcm_data ); if(ret ! 0) { std::cerr Stream error: ret std::endl; } } } // 清理资源 void cleanup() { if(g_audio_stream) { Pa_StopStream(g_audio_stream); Pa_CloseStream(g_audio_stream); Pa_Terminate(); } if(g_audio_client) { g_audio_client-PlayStop(realtime_audio); } } int main(int argc, char** argv) { if(argc 2) { std::cerr Usage: argv[0] network_interface std::endl; return 1; } std::signal(SIGINT, signal_handler); // 初始化Unitree音频客户端 unitree::robot::ChannelFactory::Instance()-Init(0, argv[1]); unitree::robot::g1::AudioClient client; client.Init(); client.SetTimeout(10.0f); client.SetVolume(80); // 80%音量 g_audio_client client; // 初始化音频流 if(!init_audio_stream()) { std::cerr Audio stream initialization failed std::endl; return 1; } std::cout Start audio streaming std::endl; run_audio_loop(); cleanup(); return 0; }对应的CMakeLists.txt完整配置cmake_minimum_required(VERSION 3.16) project(g1_realtime_audio) set(CMAKE_CXX_STANDARD 17) find_package(PkgConfig REQUIRED) pkg_check_modules(PORTAUDIO REQUIRED portaudio-2.0) include_directories( ${PORTAUDIO_INCLUDE_DIRS} ${CMAKE_SOURCE_DIR}/third_party/unitree_sdk/include ) add_executable(g1_audio src/main.cpp) target_link_libraries(g1_audio ${PORTAUDIO_LIBRARIES} ${CMAKE_SOURCE_DIR}/third_party/unitree_sdk/lib/libunitree_sdk.a )在实际部署中发现为减少网络延迟影响最好将音频采样率设置为16kHz帧大小控制在20ms以内即320个样本16kHz。同时建议添加简单的静音检测逻辑避免传输无效音频数据。

51单片机关键寄存器TCON、IE、PCON的功能解析与实战应用

1. TCON寄存器：定时器与外部中断的指挥中心 TCON寄存器是51单片机中最忙碌的"交通警察"，同时管理着定时器和外部中断两大核心功能。这个8位寄存器地址为88H，可以直接位寻址，每个位都对应着具体功能。我第一次接触TCON时…

2026/6/11 20:03:05 阅读更多

Linux桌面革命：AppImageLauncher如何让AppImage应用管理变得简单

Linux桌面革命：AppImageLauncher如何让AppImage应用管理变得简单【免费下载链接】AppImageLauncher Helper application for Linux distributions serving as a kind of "entry point" for running and integrating AppImages 项目地址: https://gitco…

2026/6/12 2:23:52 阅读更多

Bilibili视频下载终极指南：如何免费高效保存B站精彩内容

Bilibili视频下载终极指南：如何免费高效保存B站精彩内容【免费下载链接】BilibiliDown (GUI-多平台支持) B站哔哩哔哩视频下载器。支持稍后再看、收藏夹、UP主视频批量下载|Bilibili Video Downloader 😳 项目地址: https://gitcode.com/gh_mirrors…

2026/6/12 1:00:26 阅读更多

从‘空翻’到‘维持阻塞’：一个硬件Bug是如何推动D触发器演进的？聊聊数字电路的设计思维

从‘空翻’到‘维持阻塞’：一个硬件Bug是如何推动D触发器演进的？聊聊数字电路的设计思维在数字电路设计的演进史中，每一个关键突破往往源于对实际问题的深刻洞察与创造性解决。D触发器从基础形态到维持阻塞结构的演变，正是这一过程…

2026/6/12 5:12:08 阅读更多

CAD中怎么偏移目标对象？CAD偏移命令详细教程

在CAD中绘制墙体、道路边界或制作轮廓线时，我们经常需要创建与现有线条等距的平行线。“偏移”(OFFSET)功能可以快速生成一个与原对象（如直线、多段线、圆、圆弧等）形状相同、距离相等的副本，是CAD中绘制平行轮廓线的核心工具。那…

2026/6/12 5:11:07 阅读更多

Linux内核学习18--UART子系统（TODO）

（TODO）

2026/6/12 5:11:07 阅读更多

不要再说“帮我润色”了：科研写作 Prompt 应该这样写

很多科研人在使用AI辅助论文优化时，经常说的一句话就是：帮我润色一下。这句话看似很正常，但从 AI 的角度看，它其实是一个非常低效、非常模糊、也非常容易得到“看起来更好、实际上并不更准确”结果的请求。为什么？因为…

2026/6/12 5:10:06 阅读更多

2026在线去本地视频水印工具推荐，免费在线去视频水印工具合集

日常刷视频、整理个人素材时，很多本地保存的视频会带有各类水印，不仅影响观感，也不利于我们收藏和学习使用。相信不少朋友都在寻找靠谱的在线去本地视频水印工具，希望能在不复杂操作、不额外下载软件的前提下，轻松处理…

2026/6/12 5:10:06 阅读更多

终极解决方案：如何永久免费使用Cursor Pro AI编程助手

终极解决方案：如何永久免费使用Cursor Pro AI编程助手【免费下载链接】cursor-free-vip [Support 0.45]（Multi Language 多语言）自动注册 Cursor Ai ，自动重置机器ID ， 免费升级使用Pro 功能: Youve reached your tri…

2026/6/12 5:09:05 阅读更多

3分钟搞定微信QQ消息防撤回：免费开源补丁终极指南

3分钟搞定微信QQ消息防撤回：免费开源补丁终极指南【免费下载链接】RevokeMsgPatcher :trollface: A hex editor for WeChat/QQ/TIM - PC版微信/QQ/TIM防撤回补丁（我已经看到了，撤回也没用了） 项目地址: https://gitcode.com/Gi…

2026/6/12 0:02:19 阅读更多

从零构建云边协同平台：KubeEdge边缘计算框架完全指南

从零构建云边协同平台：KubeEdge边缘计算框架完全指南【免费下载链接】kubeedge Kubernetes Native Edge Computing Framework (project under CNCF) 项目地址: https://gitcode.com/GitHub_Trending/ku/kubeedge 在数字化转型浪潮中，边缘计算正成…

2026/6/12 0:02:19 阅读更多

BetterJoy完全指南：解决Switch控制器在PC上的终极兼容方案

BetterJoy完全指南：解决Switch控制器在PC上的终极兼容方案【免费下载链接】BetterJoy Allows the Nintendo Switch Pro Controller, Joycons and SNES controller to be used with CEMU, Citra, Dolphin, Yuzu and as generic XInput 项目地址: https://gitcode.…

2026/6/12 0:02:40 阅读更多

LED驱动技术全解析：从核心架构到实战选型与避坑指南

1. 从一颗灯珠到千亿市场：LED驱动的技术演进与商业逻辑十几年前，当我第一次从料盘上拿起一颗0603封装的白色LED时，它微弱的光晕和高达几块钱的单颗成本，让我很难想象今天它几乎照亮了我们生活的每一个角落。从手机屏幕的一抹背光&…

2026/6/12 1:13:40 阅读更多

索引堆及其优化

索引堆及其优化引言索引堆是一种数据结构，广泛应用于计算机科学和软件工程领域。它主要用于解决优先队列问题，如最小堆和最大堆。本文将详细介绍索引堆的概念、实现方法以及优化策略。索引堆的定义索引堆是一种基于堆数据结构的索引机制。它通过维护一个堆来存储数据…

2026/6/12 1:13:42 阅读更多

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

更多请点击： https://intelliparadigm.com 第一章：CSDN AI 数字营销的官方引流卡片是什么功能？ CSDN AI 数字营销平台推出的「官方引流卡片」，是一种面向技术创作者的轻量级、可嵌入式内容分发组件，专为提升博文、教程…

2026/6/12 1:13:40 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/11 9:57:14 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/11 9:57:16 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…