专栏系列2D/3D/视觉SLAM理论详解共10篇 |难度中级 |预计阅读26分钟前置知识传感器模型第3章、SLAM前端第4章、BA/图优化第5章本文定位第8篇讲解三种SLAM中地图表示的理论谱系——从2D占用栅格到3D高斯椭球摘要建图是SLAM的产出物——最终交付给上层应用的环境模型。本章横向对比三种SLAM的地图表示(1) 2D激光的占用栅格地图Occupancy Grid——二值贝叶斯滤波与log-odds更新(2) 3D激光的点云特征图与TSDF地图——从稀疏特征到稠密体素(3) 视觉的路标地图从稀疏共视图到稠密网格/3DGS。核心论点是地图表示的选择由传感器特性直接几何 vs 间接光度和下游任务导航 vs 渲染 vs 定位共同决定。目录1. 地图表示的理论谱系2. 2D激光占用栅格地图3. 3D激光从点云特征到TSDF4. 视觉从稀疏路标到可渲染场景5. 三种路标参数化的对比6. 地图选择的下游驱动原则1. 地图表示的理论谱系1.1 信息密度谱三种SLAM的地图表示可以从信息密度来分类表示传感器存储量更新方式典型系统占用栅格图2D激光~100KBlog-odds贝叶斯更新GMapping, Cartographer稀疏路标点视觉~100KB三角化BAORB-SLAM33D点云特征图3D激光~1-10MBLOAM特征累积LOAM, LeGO-LOAM八叉树占据图3D激光/RGB-D~5-50MBlog-odds贝叶斯更新OctoMapTSDF体素RGB-D/3D激光~500MB-2GB滑动平均融合KinectFusion, Voxblox半稠密图视觉~10MB逐像素深度滤波LSD-SLAM3D高斯椭球视觉/RGB-D~50-500MB增量添加优化3DGS-SLAM1.2 地图 传感器特性 × 下游任务地图表示的选择由两个正交因素决定传感器特性激光直接提供几何信息→自然适合几何地图栅格、体素视觉间接提供外观信息→自然适合外观几何混合地图下游任务导航需要哪里可通行占据栅格AR需要视角渲染3DGS/网格定位需要稳定的可匹配特征稀疏路标2. 2D激光占用栅格地图2.1 栅格地图的贝叶斯基础2D激光SLAM将环境划分为规则的栅格阵列。每个栅格c cc维护其被障碍物占据的后验概率P ( m c 1 ∣ z 1 : t , x 1 : t ) P(m_c 1 \mid \mathbf{z}_{1:t}, \mathbf{x}_{1:t})P(mc1∣z1:t,x1:t)。在给定轨迹的条件下RBPF的分解各栅格是条件独立的——每个栅格的占据概率仅由穿过该栅格的所有激光射线所独立确定。2.2 Log-odds更新直接使用贝叶斯公式更新概率需要乘除法有数值下溢风险。Log-odds形式将贝叶斯更新转化为一次加法L ( m c ∣ z 1 : t ) L ( m c ∣ z 1 : t − 1 ) L ( m c ∣ z t ) L(m_c \mid \mathbf{z}_{1:t}) L(m_c \mid \mathbf{z}_{1:t-1}) L(m_c \mid z_t)L(mc∣z1:t)L(mc∣z1:t−1)L(mc∣zt)其中L log P 1 − P L \log\frac{P}{1-P}Llog1−PP是log-odds。核心优势每次观测仅需一次加法Log-odds0 ↔P 0.5 P0.5P0.5完全未知正值 ↔ 被占据P 0.5 P 0.5P0.5负值 ↔ 空闲P 0.5 P 0.5P0.5占据概率随时可通过P 1 / ( 1 e − L ) P 1/(1 e^{-L})P1/(1e−L)恢复2.3 激光射线对栅格的更新一条激光射线从传感器原点x t \mathbf{x}_txt出发沿方向θ \thetaθ到达测量距离z t z_tzt处。它对沿线的栅格产生两种更新射线穿过的栅格从原点到测量终点之间的所有栅格观测为miss空闲→ log-odds减少L ← L l miss L \leftarrow L l_{\text{miss}}L←Llmissl miss 0 l_{\text{miss}} 0lmiss0测量终点的栅格射线终止处观测为hit被占据→ log-odds增加L ← L l hit L \leftarrow L l_{\text{hit}}L←Llhitl hit 0 l_{\text{hit}} 0lhit0逆传感器模型Inverse Sensor Model给定一次测量z t z_tzt推断每个栅格的占据概率。这是传感器模型的逆向——从效果一次测量读数推断原因栅格状态。2.4 栅格分辨率的选择分辨率栅格大小5m×5m区域内存精度适用1cm250,000 栅格~1MB高精确定位、室内导航5cm10,000 栅格~40KB中通用导航、扫地机器人10cm2,500 栅格~10KB低大范围拓扑导航Cartographer使用5cm分辨率的子图submap每个子图通常为200×200栅格10m×10m。多个子图通过位姿图拼接为全局地图。2.5 子图策略Cartographer的地图管理Cartographer将全局地图分解为多个独立的子图submap每个子图在局部坐标系中累积几十到几百帧的扫描子图由一组雷达扫描帧通过局部CSM构建子图内的累计位姿通过CSM估计多个子图的相对位姿通过全局位姿图优化回环后确定子图策略的好处局部约束在一个子图内紧密全局约束通过位姿图的稀疏边连接——避免了一个栅格的微小位移导致全局地图错位的问题。3. 3D激光从点云特征到TSDF3.1 LOAM的局部点云特征地图LOAM维护的地图是一组累积的特征点边缘点和平面点而非完整的3D栅格地图。这个特征地图局部性仅保留最近若干帧的特征点通过滑动窗口或距离阈值剔除旧点特征累积新帧的特征点变换到世界坐标系后并入地图用于配准新扫描不是配准到上一帧而是配准到这个累积特征地图扫描→地图配准LOAM里程计的漂移远低于帧-帧配准——因为累积地图包含多帧的信息对测量噪声有平滑效果。3.2 TSDF从点云到体素TSDF截断符号距离函数是3D稠密重建的基础表示SDF ( x ) { d ( x , S ) 若 x 在曲面外部 − d ( x , S ) 若 x 在曲面内部 0 若 x 恰好在曲面上 \text{SDF}(\mathbf{x}) \begin{cases} d(\mathbf{x}, S) \text{若 } \mathbf{x} \text{ 在曲面外部} \\ -d(\mathbf{x}, S) \text{若 } \mathbf{x} \text{ 在曲面内部} \\ 0 \text{若 } \mathbf{x} \text{ 恰好在曲面上} \end{cases}SDF(x)⎩⎨⎧d(x,S)−d(x,S)0若x在曲面外部若x在曲面内部若x恰好在曲面上截断版本仅对距曲面± δ \pm\delta±δ范围内的体素存储SDF值。每个体素存储截断SDF值D ( v ) D(\mathbf{v})D(v)和权重W ( v ) W(\mathbf{v})W(v)。TSDF的滑动平均更新D k 1 W k ⋅ D k w k 1 ⋅ d k 1 W k w k 1 , W k 1 W k w k 1 D_{k1} \frac{W_k \cdot D_k w_{k1} \cdot d_{k1}}{W_k w_{k1}}, \quad W_{k1} W_k w_{k1}Dk1Wkwk1Wk⋅Dkwk1⋅dk1,Wk1Wkwk1其中d k 1 d_{k1}dk1是新测量的SDF值从当前相机/LiDAR视角计算的投影距离。2D栅格 vs 3D TSDF的对比2D占用栅格3D TSDF更新方式Log-odds贝叶斯二值滑动平均连续值存储内容占据概率标量截断SDF值权重两标量曲面位置占据概率阈值SDF0的等值面Marching Cubes提取存储量极低2D网格高3D体素网格O ( N 3 ) O(N^3)O(N3)适用传感器2D激光RGB-D、3D激光3.3 八叉树地图OctoMap八叉树将3D空间自适应地递归分割为8个子立方体解决均匀TSDF网格存储量随分辨率立方增长的问题。每个叶节点维护log-odds占据概率。如果所有子体素处于相同状态全空闲或全占据则被剪枝为父体素——大幅压缩内存。在室内结构化场景中压缩率可达90%以上。4. 视觉从稀疏路标到可渲染场景4.1 稀疏路标 共视图定位优化的地图ORB-SLAM的地图 一组3D路标 共视图covisibility graph。共视图两个关键帧被视为共视当且仅当它们共享至少15个地图点的观测。权重 共视地图点数。局部BA仅优化与当前帧在共视图中直接相连的相机——大幅缩减局部BA规模。本质图Essential Graph共视图的稀疏化子图仅保留最强连接边用于回环修正时的高效位姿图优化。4.2 半稠密地图LSD-SLAM的梯度区域深度LSD-SLAM仅对具有足够梯度的像素进行深度估计——因为深度估计的信息主要来自图像梯度。在均匀区域如白墙深度估计的特征值趋于零。深度通过极线搜索 逆深度方差建模来估计。TV-L1深度正则化min D ∑ ∥ ∇ D ∥ 1 \min_D \sum \|\nabla D\|_1minD∑∥∇D∥1保持深度边缘的不连续性——L1允许尖锐的跳变存在物体边界处的深度突变而L2会将其模糊。4.3 3DGS地图可渲染的场景表示3D Gaussian Splatting3DGS用显式的各向异性高斯椭球表示场景均值位置μ \mathbf{\mu}μ3D坐标协方差矩阵Σ \mathbf{\Sigma}Σ空间扩展的形状和方向颜色和不透明度参数每个高斯元的空间密度G ( x ) exp ( − 1 2 ( x − μ ) T Σ − 1 ( x − μ ) ) G(\mathbf{x}) \exp\left(-\frac{1}{2}(\mathbf{x} - \mathbf{\mu})^T \mathbf{\Sigma}^{-1} (\mathbf{x} - \mathbf{\mu})\right)G(x)exp(−21(x−μ)TΣ−1(x−μ))通过可微光栅化将3D高斯按前后顺序投影到图像平面并叠加以生成像素颜色可从任意新视角渲染。相比传统地图3DGS地图同时编码了几何和外观——地图本身就可以用于渲染。5. 三种路标参数化的对比5.1 视觉SLAM中三种路标参数化视觉SLAM的路标3D点有三种数学表示(1) Euclidean坐标( X , Y , Z ) (X, Y, Z)(X,Y,Z)直观、雅可比简单∂ P / ∂ P I \partial\mathbf{P}/\partial\mathbf{P} \mathbf{I}∂P/∂PI。对远距离点不确定性建模差——100米的点的Z坐标方差可能50米这在优化中产生病态的数值条件。(2) 逆深度[ u , v , ρ ] T [u, v, \rho]^T[u,v,ρ]Tu X / Z , v Y / Z , ρ 1 / Z uX/Z, vY/Z, \rho1/ZuX/Z,vY/Z,ρ1/Z远距离点ρ → 0 \rho \to 0ρ→0在逆深度空间中是接近零的高斯分布——高斯能准确建模。ρ 0 \rho 0ρ0自然表示无穷远点。是单目SLAM初始化和远距离点的首选参数化。(3) 锚点参数化路标 锚点相机T anchor \mathbf{T}_{\text{anchor}}Tanchor 从锚点视角的逆深度ρ \rhoρ。初始化用逆深度初期不确定性建模好深度稳定后转为Euclidean计算更快。5.2 为什么激光SLAM不需要这些参数化激光SLAM中每个点的3D坐标是直接测量的距离角度 → XYZ其不确定性近似为常值高斯~1-3cm——不需要逆深度来线性化远距离的不确定性。这是本章传感器特性决定地图表示的最直接的例证。6. 地图选择的下游驱动原则6.1 下游任务与地图表示的对应下游任务最优地图表示典型传感器机器人导航2D2D占用栅格图log-odds2D激光无人机导航3D八叉树占据图自适应分辨率3D激光/RGB-DAR/虚拟内容放置稠密网格/3DGS可渲染几何RGB-D/视觉长期定位稀疏特征地图存储小、跨季节鲁棒视觉三维重建TSDFMesh连续曲面RGB-D/3D激光场景渲染3DGS/NeRF照片级外观视觉拓扑规划拓扑图节点连通性任意传感器6.2 核心原则地图是SLAM的产出但不是最终目标——是后续应用导航、AR、重建、长期定位决定了需要什么类型的地图。选择地图表示时应考虑传感器的自然信息类型激光→几何地图 / 视觉→外观几何混合地图存储和计算预算嵌入式平台→稀疏特征 / 桌面/服务器→稠密/3DGS时间尺度实时导航→轻量地图栅格/八叉树 / 离线重建→高质量地图TSDF/3DGS光照/季节鲁棒性户外→几何地图光照不变 / 室内→外观地图可用本文总结三种SLAM的地图表示由传感器特性决定激光的直接几何测量→自然适配栅格/体素/八叉树视觉的间接光度测量→适配路标描述子可渲染场景表示2D占用栅格 log-odds贝叶斯更新每次激光射线的一次加法更新hit→log-odds增加miss→log-odds减少——渐进式地建立占据/空闲信念3D激光特征图 LOAM的边缘平面点累积扫描→地图配准优于帧-帧配准多帧信息平滑噪声TSDF滑动平均融合深度观测视觉地图的演进稀疏路标共视图ORB-SLAM, 定位用 → 半稠密梯度区域LSD-SLAM, 场景结构 → 3DGS椭球可渲染, AR用路标参数化的选择取决于深度不确定性逆深度解决了远距离的高斯建模ρ → 0 \rho \to 0ρ→0vsZ → ∞ Z \to \inftyZ→∞激光不需要这些参数化——因为深度直接测量且精度与距离弱相关地图选择 下游任务驱动导航要占据栅格、AR要3DGS、定位要稀疏特征、重建要TSDFMesh标签SLAM占用栅格TSDF八叉树3DGS共视图
建图:从占用栅格到3D高斯——三种SLAM的地图表示理论
发布时间:2026/5/26 22:19:09
专栏系列2D/3D/视觉SLAM理论详解共10篇 |难度中级 |预计阅读26分钟前置知识传感器模型第3章、SLAM前端第4章、BA/图优化第5章本文定位第8篇讲解三种SLAM中地图表示的理论谱系——从2D占用栅格到3D高斯椭球摘要建图是SLAM的产出物——最终交付给上层应用的环境模型。本章横向对比三种SLAM的地图表示(1) 2D激光的占用栅格地图Occupancy Grid——二值贝叶斯滤波与log-odds更新(2) 3D激光的点云特征图与TSDF地图——从稀疏特征到稠密体素(3) 视觉的路标地图从稀疏共视图到稠密网格/3DGS。核心论点是地图表示的选择由传感器特性直接几何 vs 间接光度和下游任务导航 vs 渲染 vs 定位共同决定。目录1. 地图表示的理论谱系2. 2D激光占用栅格地图3. 3D激光从点云特征到TSDF4. 视觉从稀疏路标到可渲染场景5. 三种路标参数化的对比6. 地图选择的下游驱动原则1. 地图表示的理论谱系1.1 信息密度谱三种SLAM的地图表示可以从信息密度来分类表示传感器存储量更新方式典型系统占用栅格图2D激光~100KBlog-odds贝叶斯更新GMapping, Cartographer稀疏路标点视觉~100KB三角化BAORB-SLAM33D点云特征图3D激光~1-10MBLOAM特征累积LOAM, LeGO-LOAM八叉树占据图3D激光/RGB-D~5-50MBlog-odds贝叶斯更新OctoMapTSDF体素RGB-D/3D激光~500MB-2GB滑动平均融合KinectFusion, Voxblox半稠密图视觉~10MB逐像素深度滤波LSD-SLAM3D高斯椭球视觉/RGB-D~50-500MB增量添加优化3DGS-SLAM1.2 地图 传感器特性 × 下游任务地图表示的选择由两个正交因素决定传感器特性激光直接提供几何信息→自然适合几何地图栅格、体素视觉间接提供外观信息→自然适合外观几何混合地图下游任务导航需要哪里可通行占据栅格AR需要视角渲染3DGS/网格定位需要稳定的可匹配特征稀疏路标2. 2D激光占用栅格地图2.1 栅格地图的贝叶斯基础2D激光SLAM将环境划分为规则的栅格阵列。每个栅格c cc维护其被障碍物占据的后验概率P ( m c 1 ∣ z 1 : t , x 1 : t ) P(m_c 1 \mid \mathbf{z}_{1:t}, \mathbf{x}_{1:t})P(mc1∣z1:t,x1:t)。在给定轨迹的条件下RBPF的分解各栅格是条件独立的——每个栅格的占据概率仅由穿过该栅格的所有激光射线所独立确定。2.2 Log-odds更新直接使用贝叶斯公式更新概率需要乘除法有数值下溢风险。Log-odds形式将贝叶斯更新转化为一次加法L ( m c ∣ z 1 : t ) L ( m c ∣ z 1 : t − 1 ) L ( m c ∣ z t ) L(m_c \mid \mathbf{z}_{1:t}) L(m_c \mid \mathbf{z}_{1:t-1}) L(m_c \mid z_t)L(mc∣z1:t)L(mc∣z1:t−1)L(mc∣zt)其中L log P 1 − P L \log\frac{P}{1-P}Llog1−PP是log-odds。核心优势每次观测仅需一次加法Log-odds0 ↔P 0.5 P0.5P0.5完全未知正值 ↔ 被占据P 0.5 P 0.5P0.5负值 ↔ 空闲P 0.5 P 0.5P0.5占据概率随时可通过P 1 / ( 1 e − L ) P 1/(1 e^{-L})P1/(1e−L)恢复2.3 激光射线对栅格的更新一条激光射线从传感器原点x t \mathbf{x}_txt出发沿方向θ \thetaθ到达测量距离z t z_tzt处。它对沿线的栅格产生两种更新射线穿过的栅格从原点到测量终点之间的所有栅格观测为miss空闲→ log-odds减少L ← L l miss L \leftarrow L l_{\text{miss}}L←Llmissl miss 0 l_{\text{miss}} 0lmiss0测量终点的栅格射线终止处观测为hit被占据→ log-odds增加L ← L l hit L \leftarrow L l_{\text{hit}}L←Llhitl hit 0 l_{\text{hit}} 0lhit0逆传感器模型Inverse Sensor Model给定一次测量z t z_tzt推断每个栅格的占据概率。这是传感器模型的逆向——从效果一次测量读数推断原因栅格状态。2.4 栅格分辨率的选择分辨率栅格大小5m×5m区域内存精度适用1cm250,000 栅格~1MB高精确定位、室内导航5cm10,000 栅格~40KB中通用导航、扫地机器人10cm2,500 栅格~10KB低大范围拓扑导航Cartographer使用5cm分辨率的子图submap每个子图通常为200×200栅格10m×10m。多个子图通过位姿图拼接为全局地图。2.5 子图策略Cartographer的地图管理Cartographer将全局地图分解为多个独立的子图submap每个子图在局部坐标系中累积几十到几百帧的扫描子图由一组雷达扫描帧通过局部CSM构建子图内的累计位姿通过CSM估计多个子图的相对位姿通过全局位姿图优化回环后确定子图策略的好处局部约束在一个子图内紧密全局约束通过位姿图的稀疏边连接——避免了一个栅格的微小位移导致全局地图错位的问题。3. 3D激光从点云特征到TSDF3.1 LOAM的局部点云特征地图LOAM维护的地图是一组累积的特征点边缘点和平面点而非完整的3D栅格地图。这个特征地图局部性仅保留最近若干帧的特征点通过滑动窗口或距离阈值剔除旧点特征累积新帧的特征点变换到世界坐标系后并入地图用于配准新扫描不是配准到上一帧而是配准到这个累积特征地图扫描→地图配准LOAM里程计的漂移远低于帧-帧配准——因为累积地图包含多帧的信息对测量噪声有平滑效果。3.2 TSDF从点云到体素TSDF截断符号距离函数是3D稠密重建的基础表示SDF ( x ) { d ( x , S ) 若 x 在曲面外部 − d ( x , S ) 若 x 在曲面内部 0 若 x 恰好在曲面上 \text{SDF}(\mathbf{x}) \begin{cases} d(\mathbf{x}, S) \text{若 } \mathbf{x} \text{ 在曲面外部} \\ -d(\mathbf{x}, S) \text{若 } \mathbf{x} \text{ 在曲面内部} \\ 0 \text{若 } \mathbf{x} \text{ 恰好在曲面上} \end{cases}SDF(x)⎩⎨⎧d(x,S)−d(x,S)0若x在曲面外部若x在曲面内部若x恰好在曲面上截断版本仅对距曲面± δ \pm\delta±δ范围内的体素存储SDF值。每个体素存储截断SDF值D ( v ) D(\mathbf{v})D(v)和权重W ( v ) W(\mathbf{v})W(v)。TSDF的滑动平均更新D k 1 W k ⋅ D k w k 1 ⋅ d k 1 W k w k 1 , W k 1 W k w k 1 D_{k1} \frac{W_k \cdot D_k w_{k1} \cdot d_{k1}}{W_k w_{k1}}, \quad W_{k1} W_k w_{k1}Dk1Wkwk1Wk⋅Dkwk1⋅dk1,Wk1Wkwk1其中d k 1 d_{k1}dk1是新测量的SDF值从当前相机/LiDAR视角计算的投影距离。2D栅格 vs 3D TSDF的对比2D占用栅格3D TSDF更新方式Log-odds贝叶斯二值滑动平均连续值存储内容占据概率标量截断SDF值权重两标量曲面位置占据概率阈值SDF0的等值面Marching Cubes提取存储量极低2D网格高3D体素网格O ( N 3 ) O(N^3)O(N3)适用传感器2D激光RGB-D、3D激光3.3 八叉树地图OctoMap八叉树将3D空间自适应地递归分割为8个子立方体解决均匀TSDF网格存储量随分辨率立方增长的问题。每个叶节点维护log-odds占据概率。如果所有子体素处于相同状态全空闲或全占据则被剪枝为父体素——大幅压缩内存。在室内结构化场景中压缩率可达90%以上。4. 视觉从稀疏路标到可渲染场景4.1 稀疏路标 共视图定位优化的地图ORB-SLAM的地图 一组3D路标 共视图covisibility graph。共视图两个关键帧被视为共视当且仅当它们共享至少15个地图点的观测。权重 共视地图点数。局部BA仅优化与当前帧在共视图中直接相连的相机——大幅缩减局部BA规模。本质图Essential Graph共视图的稀疏化子图仅保留最强连接边用于回环修正时的高效位姿图优化。4.2 半稠密地图LSD-SLAM的梯度区域深度LSD-SLAM仅对具有足够梯度的像素进行深度估计——因为深度估计的信息主要来自图像梯度。在均匀区域如白墙深度估计的特征值趋于零。深度通过极线搜索 逆深度方差建模来估计。TV-L1深度正则化min D ∑ ∥ ∇ D ∥ 1 \min_D \sum \|\nabla D\|_1minD∑∥∇D∥1保持深度边缘的不连续性——L1允许尖锐的跳变存在物体边界处的深度突变而L2会将其模糊。4.3 3DGS地图可渲染的场景表示3D Gaussian Splatting3DGS用显式的各向异性高斯椭球表示场景均值位置μ \mathbf{\mu}μ3D坐标协方差矩阵Σ \mathbf{\Sigma}Σ空间扩展的形状和方向颜色和不透明度参数每个高斯元的空间密度G ( x ) exp ( − 1 2 ( x − μ ) T Σ − 1 ( x − μ ) ) G(\mathbf{x}) \exp\left(-\frac{1}{2}(\mathbf{x} - \mathbf{\mu})^T \mathbf{\Sigma}^{-1} (\mathbf{x} - \mathbf{\mu})\right)G(x)exp(−21(x−μ)TΣ−1(x−μ))通过可微光栅化将3D高斯按前后顺序投影到图像平面并叠加以生成像素颜色可从任意新视角渲染。相比传统地图3DGS地图同时编码了几何和外观——地图本身就可以用于渲染。5. 三种路标参数化的对比5.1 视觉SLAM中三种路标参数化视觉SLAM的路标3D点有三种数学表示(1) Euclidean坐标( X , Y , Z ) (X, Y, Z)(X,Y,Z)直观、雅可比简单∂ P / ∂ P I \partial\mathbf{P}/\partial\mathbf{P} \mathbf{I}∂P/∂PI。对远距离点不确定性建模差——100米的点的Z坐标方差可能50米这在优化中产生病态的数值条件。(2) 逆深度[ u , v , ρ ] T [u, v, \rho]^T[u,v,ρ]Tu X / Z , v Y / Z , ρ 1 / Z uX/Z, vY/Z, \rho1/ZuX/Z,vY/Z,ρ1/Z远距离点ρ → 0 \rho \to 0ρ→0在逆深度空间中是接近零的高斯分布——高斯能准确建模。ρ 0 \rho 0ρ0自然表示无穷远点。是单目SLAM初始化和远距离点的首选参数化。(3) 锚点参数化路标 锚点相机T anchor \mathbf{T}_{\text{anchor}}Tanchor 从锚点视角的逆深度ρ \rhoρ。初始化用逆深度初期不确定性建模好深度稳定后转为Euclidean计算更快。5.2 为什么激光SLAM不需要这些参数化激光SLAM中每个点的3D坐标是直接测量的距离角度 → XYZ其不确定性近似为常值高斯~1-3cm——不需要逆深度来线性化远距离的不确定性。这是本章传感器特性决定地图表示的最直接的例证。6. 地图选择的下游驱动原则6.1 下游任务与地图表示的对应下游任务最优地图表示典型传感器机器人导航2D2D占用栅格图log-odds2D激光无人机导航3D八叉树占据图自适应分辨率3D激光/RGB-DAR/虚拟内容放置稠密网格/3DGS可渲染几何RGB-D/视觉长期定位稀疏特征地图存储小、跨季节鲁棒视觉三维重建TSDFMesh连续曲面RGB-D/3D激光场景渲染3DGS/NeRF照片级外观视觉拓扑规划拓扑图节点连通性任意传感器6.2 核心原则地图是SLAM的产出但不是最终目标——是后续应用导航、AR、重建、长期定位决定了需要什么类型的地图。选择地图表示时应考虑传感器的自然信息类型激光→几何地图 / 视觉→外观几何混合地图存储和计算预算嵌入式平台→稀疏特征 / 桌面/服务器→稠密/3DGS时间尺度实时导航→轻量地图栅格/八叉树 / 离线重建→高质量地图TSDF/3DGS光照/季节鲁棒性户外→几何地图光照不变 / 室内→外观地图可用本文总结三种SLAM的地图表示由传感器特性决定激光的直接几何测量→自然适配栅格/体素/八叉树视觉的间接光度测量→适配路标描述子可渲染场景表示2D占用栅格 log-odds贝叶斯更新每次激光射线的一次加法更新hit→log-odds增加miss→log-odds减少——渐进式地建立占据/空闲信念3D激光特征图 LOAM的边缘平面点累积扫描→地图配准优于帧-帧配准多帧信息平滑噪声TSDF滑动平均融合深度观测视觉地图的演进稀疏路标共视图ORB-SLAM, 定位用 → 半稠密梯度区域LSD-SLAM, 场景结构 → 3DGS椭球可渲染, AR用路标参数化的选择取决于深度不确定性逆深度解决了远距离的高斯建模ρ → 0 \rho \to 0ρ→0vsZ → ∞ Z \to \inftyZ→∞激光不需要这些参数化——因为深度直接测量且精度与距离弱相关地图选择 下游任务驱动导航要占据栅格、AR要3DGS、定位要稀疏特征、重建要TSDFMesh标签SLAM占用栅格TSDF八叉树3DGS共视图