Ubuntu 22.04 下,从零搞定 Legged Gym 与 Isaac Gym 的完整避坑指南(含CUDA、PyTorch版本匹配) Ubuntu 22.04 下从零搞定 Legged Gym 与 Isaac Gym 的完整避坑指南在机器人仿真领域Legged Gym 和 Isaac Gym 作为两大重量级工具为开发者提供了强大的仿真环境。然而它们的安装过程却常常让初学者望而生畏。本文将带你一步步完成这两个工具的安装特别针对 Ubuntu 22.04 系统解决你可能遇到的各种版本兼容性问题。1. 环境准备与基础配置在开始安装之前我们需要确保系统环境已经准备就绪。Ubuntu 22.04 作为长期支持版本虽然官方文档可能没有明确支持但经过实测可以正常运行这些工具。首先我们需要安装一些基础依赖sudo apt update sudo apt install -y git curl wget build-essential cmake接下来建议使用 conda 来管理 Python 环境。如果你还没有安装 conda可以使用以下命令安装 Minicondawget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh bash Miniconda3-latest-Linux-x86_64.sh创建并激活一个专门的 Python 3.8 环境conda create -n legged_gym python3.8 conda activate legged_gym提示Python 3.8 是目前最稳定的版本选择避免使用更高版本可能带来的兼容性问题。2. CUDA 与 PyTorch 的精确匹配版本匹配问题是安装过程中最常见的绊脚石。我们需要特别注意 CUDA、PyTorch 和显卡驱动之间的兼容性。首先检查你的 NVIDIA 显卡驱动版本nvidia-smi根据输出中的 CUDA Version 信息确定你可以安装的 CUDA 工具包版本。例如如果显示 CUDA 11.7那么你应该安装 CUDA 11.x 系列。安装对应版本的 CUDA 工具包sudo apt install -y cuda-11-7然后安装匹配的 PyTorch 版本。以下是一些常见组合CUDA 版本推荐 PyTorch 版本安装命令11.71.13.1conda install pytorch1.13.1 torchvision0.14.1 torchaudio0.13.1 pytorch-cuda11.7 -c pytorch -c nvidia11.31.12.1conda install pytorch1.12.1 torchvision0.13.1 torchaudio0.12.1 pytorch-cuda11.3 -c pytorch -c nvidia10.21.10.0conda install pytorch1.10.0 torchvision0.11.1 torchaudio0.10.0 pytorch-cuda10.2 -c pytorch -c nvidia验证 PyTorch 是否正确识别了 CUDAimport torch print(torch.__version__) print(torch.cuda.is_available())3. Isaac Gym 的安装与配置Isaac Gym 的安装相对直接但仍有一些细节需要注意。首先从官网下载 Isaac Gym 的预览版包当前最新为 Preview 4。解压后进入 python 目录tar -xzvf IsaacGym_Preview_4_Package.tar.gz cd IsaacGym_Preview_4_Package/python pip install -e .测试安装是否成功cd ../examples python 1080_balls_of_solitude.py如果遇到libpython3.8.so.1.0缺失的错误可以尝试以下解决方案确认文件确实存在locate libpython3.8.so.1.0如果文件存在但依然报错设置环境变量export LD_LIBRARY_PATH$LD_LIBRARY_PATH:$CONDA_PREFIX/lib注意这个环境变量设置应该添加到你的 conda 激活脚本中以便每次激活环境时自动设置。4. Legged Gym 及其依赖的安装Legged Gym 的安装需要特别注意 rsl_rl 的版本问题这是最容易出错的部分。首先克隆 Legged Gym 仓库git clone https://github.com/leggedrobotics/legged_gym cd legged_gym安装 rsl_rl这是 Legged Gym 的核心依赖之一。关键是要使用正确的版本git clone https://github.com/leggedrobotics/rsl_rl cd rsl_rl git checkout v1.0.2 pip install -e .回到 Legged Gym 目录完成安装cd .. pip install -e .5. 常见问题与解决方案在实际安装过程中你可能会遇到以下常见问题NumPy 版本冲突pip uninstall numpy pip install numpy1.19.5 pip install matplotlib3.6.3缺少 TensorBoardpip install tensorboardCUDA 内核不匹配 确保 PyTorch 版本与 CUDA 版本完全匹配重新安装正确版本的 PyTorch。Python 共享库问题 如果遇到 Python 共享库问题可以尝试sudo apt install python3.8-devGLIBC 版本问题 对于较新的显卡可能需要更新系统 GLIBCsudo apt install libc66. 测试与验证完成所有安装后运行以下命令测试 Legged Gympython scripts/train.py --taskanymal_c_flat如果一切正常你应该能看到四足机器人在平面上行走的仿真画面。首次运行可能需要一些时间编译内核。对于性能优化可以尝试以下调整在legged_gym/legged_gym/envs/base/legged_robot_config.py中调整num_envs参数修改legged_gym/legged_gym/utils/helpers.py中的 GPU 内存分配策略7. 高级配置与自定义一旦基础环境搭建完成你可以开始探索更多高级功能自定义机器人模型修改assets/目录下的 URDF 文件调整legged_gym/legged_gym/envs/base/legged_robot.py中的物理参数训练策略调整修改rsl_rl/rsl_rl/algorithms/中的强化学习算法调整奖励函数在legged_gym/legged_gym/envs/base/legged_robot.py中的定义可视化工具使用tensorboard --logdirruns监控训练过程尝试不同的渲染模式--headless或--visualize在实际项目中我发现最耗时的部分往往是环境调试而非算法开发。因此建议在开始正式训练前先花时间确保仿真环境运行稳定。