LMDrive数据集构建完全指南：从零开始创建自动驾驶训练数据

发布时间：2026/6/9 23:23:27

LMDrive数据集构建完全指南从零开始创建自动驾驶训练数据【免费下载链接】LMDrive[CVPR 2024] LMDrive: Closed-Loop End-to-End Driving with Large Language Models项目地址: https://gitcode.com/gh_mirrors/lm/LMDriveLMDrive是一个基于大型语言模型的闭环端到端自动驾驶系统其核心在于利用高质量的自动驾驶训练数据来训练模型。本指南将详细介绍如何从零开始构建LMDrive数据集包括数据收集、预处理、标注和验证等关键步骤帮助你快速掌握自动驾驶训练数据的构建流程。1. 环境准备与项目搭建在开始数据集构建之前首先需要准备好相关的环境和工具。LMDrive项目提供了完整的数据集构建工具链你可以通过以下步骤获取项目代码并配置环境克隆LMDrive项目仓库git clone https://gitcode.com/gh_mirrors/lm/LMDrive进入项目目录并安装依赖cd LMDrive pip install -r requirements.txt初始化数据集目录结构python dataset/init_dir.py该脚本会创建sub-0到sub-3四个子目录每个子目录下包含results文件夹用于存储不同批次的采集数据。2. 数据采集生成自动驾驶场景LMDrive使用CARLA模拟器进行自动驾驶数据采集通过预设的路线和场景配置来生成多样化的驾驶数据。数据采集的核心步骤如下2.1 配置采集路线与场景项目提供了data_collection/generate_bashs.py脚本用于生成不同城镇和场景的采集脚本。该脚本定义了多种训练路线如routes_town01_short.xml、routes_town02_tiny.xml等和对应的场景配置文件如town01_all_scenarios.json。你可以通过修改该脚本来自定义采集路线和场景例如添加新的城镇路线或调整场景复杂度。2.2 批量生成采集脚本运行以下命令生成批量采集脚本python data_collection/generate_batch_collect.py该脚本会在batch_run目录下生成针对每个路线的采集脚本如run_route_routes_town01_short.sh用于并行执行多个采集任务。2.3 执行数据采集通过以下命令启动数据采集bash batch_run/run_route_routes_town01_short.sh采集过程中系统会在CARLA模拟器中自动运行预设的驾驶场景并记录多视角RGB图像、LiDAR数据、车辆状态等信息。3. 数据预处理整合与清洗采集到的原始数据需要经过预处理才能用于模型训练。LMDrive提供了tools/data_preprocessing目录下的多种脚本用于数据整合、清洗和格式转换。3.1 多视角图像拼接batch_merge_data.py脚本用于将不同视角前视、左视、右视、后视的图像拼接成一张完整的全景图像并整合对应的传感器数据和场景信息# 关键代码片段tools/data_preprocessing/batch_merge_data.py new Image.new(img_front.mode, (800, 2400)) new.paste(img_front, (0, 0)) new.paste(img_left, (0, 600)) new.paste(img_right, (0, 1200)) new.paste(img_rear, (0, 1800)) new.save(os.path.join(route, rgb_full, %04d.jpg % i))3.2 数据清洗与过滤batch_rm_blocked_data.py和batch_stat_blocked_data.py脚本用于检测和移除无效或异常数据确保数据集的质量。例如移除被遮挡的图像或传感器故障导致的数据。4. 数据标注添加语义信息高质量的标注数据是训练自动驾驶模型的关键。LMDrive提供了多种工具用于数据标注包括交通标志识别、车道线检测和场景理解等。4.1 自动标注工具tools/data_parsing目录下的脚本如parse_instruction.py、follow_rules.py可用于自动解析驾驶指令和交通规则为数据添加语义标签。例如识别左转、停车等导航指令并关联对应的图像和传感器数据。4.2 标注数据格式标注数据以JSON格式存储包含车辆状态、环境信息、交通参与者等详细信息。以下是一个标注数据的示例{ timestamp: 1620000000, position: {x: 100.0, y: 200.0, z: 0.0}, velocity: {x: 10.0, y: 0.0, z: 0.0}, actors_data: [ {id: 1, type: car, position: {x: 110.0, y: 200.0, z: 0.0}} ], stop_sign: true }5. 数据集验证与优化数据集构建完成后需要进行验证和优化确保数据的质量和多样性。5.1 数据质量检查通过可视化工具检查数据的完整性和标注的准确性。例如使用LAVIS/app/dataset_browser.py查看数据集样本确保图像拼接正确、标注信息完整。5.2 数据集多样性分析分析数据集的场景分布、天气条件、交通状况等确保覆盖各种驾驶场景。LMDrive提供了多种路线和场景配置可通过调整data_collection/generate_bashs.py中的参数来增加数据集的多样性。6. 数据集使用训练自动驾驶模型构建好的数据集可用于训练LMDrive的自动驾驶模型。以下是使用数据集进行模型训练的基本步骤配置训练参数修改lavis/projects/lmdrive/drivegpt.yaml文件设置数据集路径、模型参数等。启动训练python train.py --cfg lavis/projects/lmdrive/drivegpt.yaml评估模型性能python evaluate.py --cfg lavis/projects/lmdrive/drivegpt.yaml总结LMDrive数据集构建是一个涵盖数据采集、预处理、标注和验证的完整流程。通过本指南你可以从零开始创建高质量的自动驾驶训练数据为训练高性能的自动驾驶模型奠定基础。无论是调整采集场景、优化数据预处理还是扩展标注维度LMDrive提供的工具链都能满足你的需求帮助你构建定制化的自动驾驶数据集。LMDrive数据处理流程图展示了从多视角RGB和LiDAR数据到控制信号的完整处理流程集成了视觉编码器和大型语言模型【免费下载链接】LMDrive[CVPR 2024] LMDrive: Closed-Loop End-to-End Driving with Large Language Models项目地址: https://gitcode.com/gh_mirrors/lm/LMDrive创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

从数据手册到实战：K40微控制器时钟与ADC电气特性深度解析

1. 项目概述：从数据手册到设计实战拿到一份动辄数百页的微控制器数据手册，面对密密麻麻的电气特性表格，很多工程师的第一反应是直接翻到引脚定义和例程部分。然而，真正决定一个嵌入式系统性能上限、稳定性和功耗下限的&#xff0c…

2026/6/9 23:23:27 阅读更多

Motion-Matching实战：使用raylib和raygui构建实时动画演示的终极指南 [特殊字符]

Motion-Matching实战：使用raylib和raygui构建实时动画演示的终极指南 🎮 【免费下载链接】Motion-Matching Learned Motion Matching example implementation and source code for the article "Code vs Data Driven Displacement" 项目地址…

2026/6/9 23:23:06 阅读更多

AtlasOS：Windows系统性能优化的终极开源方案

AtlasOS：Windows系统性能优化的终极开源方案【免费下载链接】Atlas 🚀 An open and lightweight modification to Windows, designed to optimize performance, privacy and usability. 项目地址: https://gitcode.com/GitHub_Trending/atlas1/Atlas …

2026/6/9 23:22:45 阅读更多

终极AI对话神器：ChatALL让多个智能助手同时为你工作

终极AI对话神器：ChatALL让多个智能助手同时为你工作【免费下载链接】ChatALL Concurrently chat with ChatGPT, Bing Chat, Bard, Alpaca, Vicuna, Claude, ChatGLM, MOSS, 讯飞星火, 文心一言 and more, discover the best answers 项目地址: https://gitcode.…

2026/6/10 0:29:28 阅读更多

数据分析师试听课士AI课，这3个设计让我决定继续跟完

从「跑SQL取数」到「用大模型干活」：一个数据分析师的试听课手记上周刷到码士集团的AI大模型试听课，说实话一开始是抵触的。干了四年数据分析师，每天就是Hive调SQL、给业务出报表，偶尔用Python做个预测模型。市面上那些AI课我也看…

2026/6/10 0:28:27 阅读更多

从Java后端转大模型，码士课程能补上哪些技能缺口

Java后端工程师想转大模型方向，表面看只是换门语言、学几个框架，实际踩过坑的人都知道，这里面的断层远比想象中深。我自己身边就有不少从Java背景出发、正在摸索转型的朋友，他们的困惑高度一致：Python生态里的工具链怎…

2026/6/10 0:28:27 阅读更多

大模型长上下文处理与记忆压缩：从“金鱼记忆“到“长期记忆“的工程实践

大模型长上下文处理与记忆压缩：从"金鱼记忆"到"长期记忆"的工程实践一、大模型的"记忆瓶颈"：上下文窗口就是全部记忆大模型的推理能力受限于上下文窗口长度。GPT-4 的 128K token 窗口看似很大，但在实际应用中…

2026/6/10 0:27:26 阅读更多

5分钟快速上手：抖音免费下载工具完整使用教程

5分钟快速上手：抖音免费下载工具完整使用教程【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fallback support. 抖音…

2026/6/10 0:27:26 阅读更多

多模态 Agent 的视觉理解与工具调用：让 AI 看见世界并采取行动

多模态 Agent 的视觉理解与工具调用：让 AI 看见世界并采取行动一、Agent 的"视觉盲区"：能说会道，但看不见当前大多数 AI Agent 基于纯文本交互——用户描述问题，Agent 分析并调用工具。但现实世界的问题往往需要视觉理…

2026/6/10 0:27:26 阅读更多

NomNom存档编辑器架构解析：跨平台游戏数据管理技术实现深度剖析

NomNom存档编辑器架构解析：跨平台游戏数据管理技术实现深度剖析【免费下载链接】NomNom NomNom is the most complete savegame editor for NMS but also shows additional information around the data youre about to change. You can also easily look up each …

2026/6/10 0:00:34 阅读更多

从导航软件到游戏寻路：用C++手把手实现Dijkstra最短路径算法（附完整代码）

从导航软件到游戏寻路：用C手把手实现Dijkstra最短路径算法每次打开手机地图导航，或是操控游戏角色穿越复杂地形时，背后都藏着一个数学魔法——最短路径算法。Dijkstra算法作为图论中的经典解决方案，从1956年诞生至今，已…

2026/6/10 0:01:14 阅读更多

告别B站收藏夹吃灰：用BiliTools让每一秒学习都物超所值

告别B站收藏夹吃灰：用BiliTools让每一秒学习都物超所值【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱，支持下载视频、番剧等等各类资源项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/6/10 0:02:17 阅读更多

LED驱动技术全解析：从核心架构到实战选型与避坑指南

1. 从一颗灯珠到千亿市场：LED驱动的技术演进与商业逻辑十几年前，当我第一次从料盘上拿起一颗0603封装的白色LED时，它微弱的光晕和高达几块钱的单颗成本，让我很难想象今天它几乎照亮了我们生活的每一个角落。从手机屏幕的一抹背光&…

2026/6/9 0:23:00 阅读更多

索引堆及其优化

索引堆及其优化引言索引堆是一种数据结构，广泛应用于计算机科学和软件工程领域。它主要用于解决优先队列问题，如最小堆和最大堆。本文将详细介绍索引堆的概念、实现方法以及优化策略。索引堆的定义索引堆是一种基于堆数据结构的索引机制。它通过维护一个堆来存储数据…

2026/6/9 0:23:12 阅读更多

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

更多请点击： https://intelliparadigm.com 第一章：CSDN AI 数字营销的官方引流卡片是什么功能？ CSDN AI 数字营销平台推出的「官方引流卡片」，是一种面向技术创作者的轻量级、可嵌入式内容分发组件，专为提升博文、教程…

2026/6/9 0:15:30 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/9 9:53:26 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/9 9:53:26 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/9 9:53:22 阅读更多

相关文章

从数据手册到实战：K40微控制器时钟与ADC电气特性深度解析

Motion-Matching实战：使用raylib和raygui构建实时动画演示的终极指南 [特殊字符]

AtlasOS：Windows系统性能优化的终极开源方案

终极AI对话神器：ChatALL让多个智能助手同时为你工作

数据分析师试听课士AI课，这3个设计让我决定继续跟完

从Java后端转大模型，码士课程能补上哪些技能缺口

大模型长上下文处理与记忆压缩：从“金鱼记忆“到“长期记忆“的工程实践

5分钟快速上手：抖音免费下载工具完整使用教程

多模态 Agent 的视觉理解与工具调用：让 AI 看见世界并采取行动

NomNom存档编辑器架构解析：跨平台游戏数据管理技术实现深度剖析

从导航软件到游戏寻路：用C++手把手实现Dijkstra最短路径算法（附完整代码）

告别B站收藏夹吃灰：用BiliTools让每一秒学习都物超所值

LED驱动技术全解析：从核心架构到实战选型与避坑指南

索引堆及其优化

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因