想玩转人体姿态估计？从零开始用Python解析LSP数据集（附完整代码）

发布时间：2026/6/2 22:38:50

从零解析LSP数据集Python实战人体姿态估计数据预处理在计算机视觉领域人体姿态估计一直是热门研究方向之一。而想要入门这个领域第一步往往不是搭建复杂的神经网络模型而是学会如何处理原始数据集。Leeds Sports PoseLSP作为经典的人体姿态估计基准数据集包含了2000张运动场景图像和对应的14个关键点标注是初学者理想的练手材料。但当你真正下载这个数据集后可能会被MATLAB格式的.mat文件和复杂的目录结构搞得一头雾水。本文将带你一步步用Python解析LSP数据集从读取原始数据到可视化验证最终转换为更通用的JSON格式。不同于简单的数据集介绍我们聚焦于拿到数据后第一步该做什么这个实际问题提供可直接复用的代码和清晰的思路。无论你是刚接触计算机视觉的学生还是想扩展技能树的开发者都能通过这个实战案例掌握数据处理的关键技能。1. 理解LSP数据集结构LSP数据集解压后通常包含以下文件和目录LSP_dataset/ ├── images/ # 原始图像2000张JPEG ├── visualized/ # 带标注的可视化图像2000张 ├── joints.mat # MATLAB格式的标注数据 └── README.txt # 数据集说明文件关键点标注存储在joints.mat文件中这是一个MATLAB格式的二进制文件包含一个3×14×2000的矩阵。其中第一个维度3分别表示x坐标、y坐标和可见性0不可见1可见第二个维度14对应14个人体关键点第三个维度2000对应2000张图像14个关键点的顺序固定为右脚踝右膝盖右髋部左髋部左膝盖左脚踝右手腕右肘部右肩部左肩部左肘部左手腕颈部头顶2. 环境准备与依赖安装在开始处理数据前我们需要准备Python环境并安装必要的库。推荐使用Python 3.7版本并创建一个干净的虚拟环境python -m venv lsp_env source lsp_env/bin/activate # Linux/Mac # 或 lsp_env\Scripts\activate # Windows安装所需依赖库pip install numpy scipy matplotlib opencv-python tqdm这些库的作用分别是numpy处理多维数组数据scipy读取MATLAB格式文件matplotlib数据可视化opencv-python图像处理tqdm进度条显示3. 解析MATLAB标注文件使用Python解析.mat文件的核心是scipy.io.loadmat函数。下面我们创建一个Python脚本来提取关键点信息import numpy as np from scipy.io import loadmat def parse_lsp_mat(mat_path): 解析LSP数据集的joints.mat文件参数: mat_path: joints.mat文件路径返回: joints_array: 形状为(2000, 14, 3)的numpy数组 2000张图像14个关键点每个点有(x,y,visibility)三个值 mat_data loadmat(mat_path) joints mat_data[joints] # 提取关键数据 # 调整数组维度顺序为(图像数量, 关键点数量, 坐标可见性) joints_array np.transpose(joints, (2, 1, 0)) return joints_array调用这个函数并检查数据joints_array parse_lsp_mat(LSP_dataset/joints.mat) print(f数据集形状: {joints_array.shape}) print(第一张图像的第一个关键点信息(x,y,visibility):) print(joints_array[0, 0])4. 可视化验证标注数据为了确保我们正确解析了数据最好的方法是可视化原始图像和对应的关键点。下面是一个可视化函数import cv2 import matplotlib.pyplot as plt def visualize_keypoints(img_path, keypoints, visibility_threshold0.5): 可视化图像和关键点参数: img_path: 图像路径 keypoints: 14个关键点的坐标和可见性形状为(14,3) visibility_threshold: 可见性阈值 img cv2.imread(img_path) img cv2.cvtColor(img, cv2.COLOR_BGR2RGB) # 转换颜色通道 plt.figure(figsize(10, 10)) plt.imshow(img) # 定义关键点连接线骨架 skeleton [ (13, 12), # 头顶到颈部 (12, 8), # 颈部到右肩 (8, 7), # 右肩到右肘 (7, 6), # 右肘到右手腕 (12, 9), # 颈部到左肩 (9, 10), # 左肩到左肘 (10, 11), # 左肘到左手腕 (12, 2), # 颈部到右髋 (2, 1), # 右髋到右膝 (1, 0), # 右膝到右脚踝 (12, 3), # 颈部到左髋 (3, 4), # 左髋到左膝 (4, 5) # 左膝到左脚踝 ] # 绘制关键点 for i, (x, y, vis) in enumerate(keypoints): if vis visibility_threshold: plt.scatter(x, y, colorred, s50) plt.text(x, y, str(i), colorwhite, fontsize8) # 绘制骨架连线 for (i, j) in skeleton: if (keypoints[i, 2] visibility_threshold and keypoints[j, 2] visibility_threshold): plt.plot( [keypoints[i, 0], keypoints[j, 0]], [keypoints[i, 1], keypoints[j, 1]], linewidth2, colorgreen ) plt.axis(off) plt.show()使用示例# 选择第一张图像进行可视化 img_idx 0 img_path fLSP_dataset/images/im{img_idx1:04d}.jpg keypoints joints_array[img_idx] visualize_keypoints(img_path, keypoints)5. 转换为通用数据格式为了更方便地在不同框架中使用这些数据我们可以将其转换为JSON格式。下面是将整个数据集转换为JSON的函数import json import os from tqdm import tqdm def convert_lsp_to_json(dataset_dir, output_path): 将LSP数据集转换为JSON格式参数: dataset_dir: 数据集根目录 output_path: 输出的JSON文件路径 # 解析MATLAB文件 mat_path os.path.join(dataset_dir, joints.mat) joints_array parse_lsp_mat(mat_path) # 准备JSON数据结构 data { info: { dataset: Leeds Sports Pose (LSP), keypoints: [ right_ankle, right_knee, right_hip, left_hip, left_knee, left_ankle, right_wrist, right_elbow, right_shoulder, left_shoulder, left_elbow, left_wrist, neck, head_top ], skeleton: [ [13, 12], [12, 8], [8, 7], [7, 6], [12, 9], [9, 10], [10, 11], [12, 2], [2, 1], [1, 0], [12, 3], [3, 4], [4, 5] ] }, images: [] } # 遍历所有图像 image_dir os.path.join(dataset_dir, images) total_images joints_array.shape[0] for img_idx in tqdm(range(total_images), descProcessing images): img_name fim{img_idx1:04d}.jpg img_path os.path.join(image_dir, img_name) # 获取图像尺寸 img cv2.imread(img_path) height, width img.shape[:2] # 准备关键点数据 keypoints [] for x, y, vis in joints_array[img_idx]: keypoints.extend([float(x), float(y), float(vis)]) # 添加到JSON结构 data[images].append({ file_name: img_name, width: width, height: height, keypoints: keypoints }) # 保存为JSON文件 with open(output_path, w) as f: json.dump(data, f, indent2) print(f转换完成结果已保存到 {output_path})调用这个函数convert_lsp_to_json(LSP_dataset, lsp_dataset.json)生成的JSON文件结构如下{ info: { dataset: Leeds Sports Pose (LSP), keypoints: [ right_ankle, right_knee, right_hip, left_hip, left_knee, left_ankle, right_wrist, right_elbow, right_shoulder, left_shoulder, left_elbow, left_wrist, neck, head_top ], skeleton: [ [13, 12], [12, 8], [8, 7], [7, 6], [12, 9], [9, 10], [10, 11], [12, 2], [2, 1], [1, 0], [12, 3], [3, 4], [4, 5] ] }, images: [ { file_name: im0001.jpg, width: 202, height: 202, keypoints: [x1,y1,vis1, x2,y2,vis2, ..., x14,y14,vis14] }, ... ] }6. 数据增强与预处理技巧原始数据直接用于训练可能效果不佳这里介绍几个实用的预处理技巧6.1 关键点归一化将关键点坐标归一化到[0,1]范围使模型不受图像绝对尺寸影响def normalize_keypoints(keypoints, img_width, img_height): 归一化关键点坐标参数: keypoints: 原始关键点数组形状为(14,3) img_width: 图像宽度 img_height: 图像高度返回: 归一化后的关键点数组 normalized keypoints.copy() normalized[:, 0] / img_width # x坐标归一化 normalized[:, 1] / img_height # y坐标归一化 return normalized6.2 数据增强示例随机水平翻转水平翻转是姿态估计中常用的数据增强方法但需要注意左右关键点的对应关系def horizontal_flip(image, keypoints): 水平翻转图像和关键点参数: image: 原始图像(numpy数组) keypoints: 原始关键点数组形状为(14,3) 返回: flipped_image: 翻转后的图像 flipped_keypoints: 翻转后的关键点 # 翻转图像 flipped_image cv2.flip(image, 1) # 定义左右对称的关键点索引 left_right_pairs [ (0, 5), # 右脚踝 - 左脚踝 (1, 4), # 右膝盖 - 左膝盖 (2, 3), # 右髋部 - 左髋部 (6, 11), # 右手腕 - 左手腕 (7, 10), # 右肘部 - 左肘部 (8, 9) # 右肩部 - 左肩部 ] # 创建翻转后的关键点数组 flipped_keypoints keypoints.copy() width image.shape[1] # 处理对称关键点 for i, j in left_right_pairs: flipped_keypoints[i], flipped_keypoints[j] keypoints[j].copy(), keypoints[i].copy() flipped_keypoints[i, 0] width - keypoints[j, 0] # 调整x坐标 flipped_keypoints[j, 0] width - keypoints[i, 0] # 处理不对称关键点(颈部和头顶) flipped_keypoints[12, 0] width - keypoints[12, 0] # 颈部 flipped_keypoints[13, 0] width - keypoints[13, 0] # 头顶 return flipped_image, flipped_keypoints6.3 创建PyTorch数据集类为了更方便地在PyTorch中使用LSP数据集我们可以创建一个自定义Dataset类import torch from torch.utils.data import Dataset class LSPDataset(Dataset): def __init__(self, json_path, transformNone): 初始化LSP数据集参数: json_path: 转换后的JSON文件路径 transform: 数据增强变换 with open(json_path) as f: self.data json.load(f) self.transform transform self.keypoint_names self.data[info][keypoints] self.skeleton self.data[info][skeleton] def __len__(self): return len(self.data[images]) def __getitem__(self, idx): img_info self.data[images][idx] img_path os.path.join(LSP_dataset, images, img_info[file_name]) # 加载图像 image cv2.imread(img_path) image cv2.cvtColor(image, cv2.COLOR_BGR2RGB) # 获取关键点(形状为[14,3]) keypoints np.array(img_info[keypoints]).reshape(-1, 3) # 应用变换 if self.transform: image, keypoints self.transform(image, keypoints) # 转换为torch张量 image torch.from_numpy(image).permute(2, 0, 1).float() / 255.0 keypoints torch.from_numpy(keypoints).float() return image, keypoints使用示例dataset LSPDataset(lsp_dataset.json) print(f数据集大小: {len(dataset)}) # 获取第一个样本 image, keypoints dataset[0] print(f图像形状: {image.shape}) print(f关键点形状: {keypoints.shape})7. 常见问题与解决方案在实际处理LSP数据集时可能会遇到以下问题7.1 关键点可见性处理LSP数据集中的关键点可见性标记有时不够准确。建议的处理策略训练时对不可见关键点(x,y)坐标使用零值并在损失函数中通过可见性标记加权评估时只计算可见关键点的精度def prepare_for_training(keypoints): 准备训练用的关键点数据参数: keypoints: 原始关键点数组形状为(14,3) 返回: processed: 处理后的关键点不可见点的坐标置零 processed keypoints.copy() invisible processed[:, 2] 0.5 # 可见性阈值 processed[invisible, :2] 0 # 不可见点的坐标置零 return processed7.2 图像尺寸不一致虽然LSP图像尺寸相近但仍存在细微差异。建议统一调整尺寸def resize_image_and_keypoints(image, keypoints, target_size(256, 256)): 调整图像尺寸并相应调整关键点坐标参数: image: 原始图像 keypoints: 原始关键点数组形状为(14,3) target_size: 目标尺寸(宽,高) 返回: resized_image: 调整后的图像 resized_keypoints: 调整后的关键点 h, w image.shape[:2] new_w, new_h target_size # 调整图像尺寸 resized_image cv2.resize(image, target_size) # 调整关键点坐标 resized_keypoints keypoints.copy() resized_keypoints[:, 0] keypoints[:, 0] * (new_w / w) resized_keypoints[:, 1] keypoints[:, 1] * (new_h / h) return resized_image, resized_keypoints7.3 数据不平衡问题LSP数据集包含不同运动类别某些姿势可能样本较少。解决方案过采样复制少数类别的样本数据增强对少数类别使用更激进的数据增强类别加权在损失函数中为不同类别设置不同权重def analyze_pose_distribution(json_path): 分析姿势分布情况(简化版) 参数: json_path: 转换后的JSON文件路径 with open(json_path) as f: data json.load(f) # 这里简化分析实际应根据图像内容分类 # 例如通过关键点角度判断姿势类型 print(总样本数:, len(data[images])) print(关键点名称:, data[info][keypoints])处理LSP数据集时我发现在可视化阶段最容易出现问题。特别是当关键点坐标超出图像范围时可视化会失败。一个实用的调试技巧是添加边界检查def safe_visualize(img_path, keypoints, img_size(202, 202)): 带边界检查的可视化函数参数: img_path: 图像路径 keypoints: 关键点数组形状为(14,3) img_size: 图像尺寸(宽,高) # 检查关键点是否在图像范围内 valid np.logical_and.reduce([ keypoints[:, 0] 0, keypoints[:, 0] img_size[0], keypoints[:, 1] 0, keypoints[:, 1] img_size[1], keypoints[:, 2] 0.5 # 可见 ]) if not np.all(valid): print(f警告: 图像 {img_path} 中有 {np.sum(~valid)} 个关键点在图像外) # 调用原始可视化函数 visualize_keypoints(img_path, keypoints)

AI入职引导系统失败案例解析与防翻车架构设计

1. 项目概述：当AI入职引导“翻车”时“欢迎加入我们！这是你的新伙伴，AI助手。” 想象一下，一位新员工在入职第一天，满怀期待地打开公司配备的智能入职引导系统，屏幕上却弹出一个冰冷的提示框：“…

2026/6/2 16:46:43 阅读更多

移动端LLM推理加速：LP-Spec架构与推测推理优化

1. 移动端LLM推理加速的挑战与机遇在智能手机和笔记本电脑等移动设备上部署大型语言模型（LLM）正成为行业趋势，但这类设备面临着严格的能耗、面积和延迟限制。传统自回归解码（Autoregressive Decoding）方式需要逐个生成…

2026/6/2 21:30:56 阅读更多

搞懂ATPG的几种Pattern：时钟PO、顺序电路、RAM测试到底怎么配？

ATPG模式选择实战指南：时钟PO、顺序电路与RAM测试的黄金配置法则在芯片测试领域，ATPG（自动测试模式生成）工具如同一位精密的外科医生，而不同的Pattern类型则是它手中的手术刀——每种刀具都有其特定的使用场景和操作技…

2026/6/2 16:29:01 阅读更多

stm32 HAL库（2）cubemx 点灯（B站keysking教程）

1.原理图2.建立环境并初始化工程这里我想申明一下操作，这里的ctrls 实际上能够保存cubemx生成的文集知识点在CubeMix界面，使用User Label 来标签化引脚，实际上实在main.h 文件进行了宏定义的替换。

2026/6/3 6:36:01 阅读更多

2026年硬核测评：10款降AIGC网站深度横评（附对比表）

随着高校对论文中AI生成内容的审查越来越严格，越来越多的学生开始感受到前所未有的压力。不少同学为了完成一篇高质量的论文，熬夜奋战、反复修改，结果一查AIGC率还是超标，真是让人又气又急。更头疼的是，手动修改不仅费…

2026/6/3 6:36:01 阅读更多

资源效率革命：从计算优化到绿色科研的实践指南

1. 项目概述：一场静悄悄的“资源效率革命”最近和几位在高校做科研的朋友聊天，他们不约而同地提到了一个词：“资源效率”。这让我想起几年前，大家还在热衷于比拼谁的服务器配置更高、谁的实验数据量更大。但现在，风向明…

2026/6/3 6:36:01 阅读更多

共沸脱水技术及其在光刻胶用PGMEA纯化中的应用（上）

埃立斯平衡蒸馏器结构图第一节：共沸脱水技术：从原理到工业应用一、共沸脱水技术的基本原理与核心概念共沸脱水技术是一种利用共沸现象实现混合物分离的化工单元操作，特别适用于分离常规蒸馏难以处理的液体混合物。其核心在于通过引入第三种组…

2026/6/3 6:34:40 阅读更多

别再只盯着S参数了！用CST时域求解器里的Energy和Balance结果给你的仿真做个‘体检’

电磁仿真进阶指南：如何通过能量监控数据验证CST时域求解结果可靠性在电磁仿真领域，时域求解器因其直观的物理过程和广泛的应用场景，成为工程师们最常用的工具之一。然而，许多用户往往只关注最终的S参数结果，却忽略了仿…

2026/6/3 6:34:20 阅读更多

基于IMU传感器的智能姿态感知平板原型设计与实现

1. 项目概述：当“妈妈的话”遇上传感器“坐直了！别驼背！”——这句话是不是听起来特别耳熟？从小到大，妈妈们总是不厌其烦地提醒我们注意姿势。以前总觉得这是唠叨，直到自己腰酸背痛、颈椎不适找上门来&…

2026/6/3 6:34:20 阅读更多

解决Unity打包EXE后Universal Media Player播放RTSP失败：从修改Player Settings到手动修复UMPPostBuilds.cs

Unity打包EXE后Universal Media Player播放RTSP失败的深度修复指南当你在Unity中使用Universal Media Player（UMP）插件成功实现了RTSP流的播放，却在打包EXE后遭遇"无画面"或"找不到库文件"的错误时，这种从开发…

2026/6/3 0:00:49 阅读更多

ESP32工业物联网控制器：4-20mA压力变送器信号采集与处理实战

1. 项目概述与核心价值在工业现场，数据采集的稳定性和准确性是命脉。无论是监测管道压力、罐体液位还是电机转速，我们都需要将物理世界的信号，可靠地转换为控制系统能理解的“语言”。这其中，4-20mA电流环信号堪称工业模拟信号传输…

2026/6/3 0:00:49 阅读更多

基于Arduino与超声波传感器的DIY无人机计时门设计与实现

1. 项目概述：为FPV竞速增添专业感的DIY计时门如果你和我一样，家里有个对FPV无人机着迷的孩子，或者你自己就是个竞速爱好者，那你肯定理解那种想给自家的小型无人机赛道增加点“专业感”的冲动。我们在地下室用纸箱、呼啦圈搭过各种…

2026/6/3 0:00:49 阅读更多

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

Realtek 8188GU网卡驱动故障深度修复指南：从原理到实战当设备管理器里那个顽固的黄色感叹号挥之不去，而你已经尝试了所有"标准操作"——Windows自动更新、第三方驱动工具、甚至重启大法——却依然无济于事时，是时候换个思路了。这篇…

2026/6/3 4:17:19 阅读更多

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

AnolisOS 8.8安装源配置实战指南：从诊断到解决方案的全流程解析当你在安装AnolisOS 8.8时遇到"设置基础软件仓库时出错"的提示，这通常意味着系统无法访问或识别安装源。这个问题看似简单，但背后可能涉及网络配置、镜像选择、启动参…

2026/6/3 4:17:20 阅读更多

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

1. 项目概述与核心思路最近在整理工作室的电子元件，翻出来几个闲置的街机按钮和一块树莓派Pico，灵机一动，决定做个简单又有趣的反应速度测试游戏。这个项目非常适合想入门嵌入式开发的朋友，它不涉及复杂的传感器和通信协议&#x…

2026/6/3 4:17:20 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/3 5:40:28 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/3 4:17:20 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/3 4:17:19 阅读更多

相关文章

AI入职引导系统失败案例解析与防翻车架构设计

移动端LLM推理加速：LP-Spec架构与推测推理优化

搞懂ATPG的几种Pattern：时钟PO、顺序电路、RAM测试到底怎么配？

stm32 HAL库（2）cubemx 点灯 （B站keysking教程）

2026年硬核测评：10款降AIGC网站深度横评（附对比表）

资源效率革命：从计算优化到绿色科研的实践指南

共沸脱水技术及其在光刻胶用PGMEA纯化中的应用（上）

别再只盯着S参数了！用CST时域求解器里的Energy和Balance结果给你的仿真做个‘体检’

基于IMU传感器的智能姿态感知平板原型设计与实现

解决Unity打包EXE后Universal Media Player播放RTSP失败：从修改Player Settings到手动修复UMPPostBuilds.cs

ESP32工业物联网控制器：4-20mA压力变送器信号采集与处理实战

基于Arduino与超声波传感器的DIY无人机计时门设计与实现

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

stm32 HAL库（2）cubemx 点灯（B站keysking教程）