LiDAR-NeRF


  • Description:LiDAR-NeRF 论文笔记 (读 arXiv 全文后所写) — 新视角 LiDAR 合成,把点云投成 range image 后用 NeRF 体渲染同时建模深度/强度/ray-drop,结构正则 + NeRF-MVL 基准
  • Paper:Tang, T., Gao, L., Wang, G., Lao, Y., Chen, P., Zhao, H., Hao, D., Liang, X., Salzmann, M., & Yu, K. (2023). LiDAR-NeRF: Novel LiDAR View Synthesis via Neural Radiance Fields. ACM MM 2024. arXiv:2304.10406
  • K2E-B ID:[K2E-B-G5-12]
  • Max3 PDF[K2E] SLAM/[K2E-B-G] Geometry & Rendering/[K2E-B-G5] NeRF SLAM/[K2E-B-G5-12][2023] LiDAR-NeRF Novel LiDAR View Synthesis via Neural Radiance Fields.pdf
  • Notion ID:(待创建)
  • Created:2024-03-31
  • Updated:2026-06-02
  • License转载欢迎 — 请署名 Yu Zhang 并链回 yuzhang.io 原文

Table of Contents


1. 概述

LiDAR-NeRF (Tang et al. 2023, ACM MM 2024) — 新视角 LiDAR 合成:给多视角 LiDAR 观测,生成新视角下的点云。

与 RGB NeRF 本质不同:LiDAR 是稀疏 3D 测量 + 传感器属性 (强度、ray-drop),不是稠密像素颜色。LiDAR-NeRF 把点云投成 range image 后套 NeRF 体渲染,同时建模几何 + 强度 + ray-drop

NeRF 体渲染见 NeRF (G6-1);LiDAR 隐式 SLAM 见 NeRF-LOAM / LONER。本笔记读 arXiv 全文。

2. range image 表示

把 3D 点云投成 $H\times W$ range 伪图,每像素 = 一条激光束。点 $(x,y,z)$ (距离 $d$):

$$ h = \left(1 - \frac{\arcsin(z/d) + |f_{down}|}{f_v}\right)\times H, \quad w = \frac{1}{2}\left(1 - \frac{\arctan(y,x)}{\pi}\right)\times W $$

($f_v$ 垂直 FOV,$f_{down}$ 下视角)。转成图像域 → 可套用 NeRF 体渲染框架。

3. 可微 LiDAR 渲染

隐式场对位置 $\mathbf{x}$ + 方向 $\boldsymbol{\theta}$ 输出三量:

$$ (\sigma, i, p) = f(\mathbf{x}, \boldsymbol{\theta}) $$

  • $\sigma$ 密度 (几何)、$i$ 强度 (反射)、$p$ ray-drop 概率 (激光未返回)

逐射线积分 (同 NeRF 体渲染权重 $w_i = T_i(1-e^{-\sigma_i\delta_i})$):

$$ \hat{D}(\mathbf{r}) = \sum_i w_i t_i, \quad \hat{I}(\mathbf{r}) = \sum_i w_i i_i, \quad \hat{P}(\mathbf{r}) = \sum_i w_i p_i $$

在可微框架里联合建几何 + 传感器属性。

4. 结构正则与损失

标准 NeRF 忽略低纹理区 (平地) 的局部结构。提出结构正则 (仅在低纹理区用梯度掩码 GM):

$$ \mathcal{L}_{reg} = |\hat{GM}(R) - GM(R)|_1 $$

总损失:

$$ \mathcal{L}{total} = \mathcal{L}{distance} + \lambda_1\mathcal{L}{intensity} + \lambda_2\mathcal{L}{raydrop} + \lambda_3\mathcal{L}_{reg} $$

权重:$\lambda_1=\lambda_2=1$、$\lambda_3=100$。

5. NeRF-MVL 基准与结果

  • 提出 NeRF-MVL 基准:76k+ 帧、9 类物体 (护柱/车/行人/桥墩/植物/护栏/轮胎/锥桶/警示牌)、多 LiDAR 绕物体方形轨迹 (7m/15m) 采集 360° 视角
  • KITTI-360 (场景级):Chamfer 0.081 (PCGen 0.187)、$\delta_1$ 82.18% (76.90%)
  • NeRF-MVL (物体级):Chamfer 0.005 (PCGen 0.078)、F-score 98.50% (90.40%)
  • 显著超基于模型的仿真器 (LiDARsim/PCGen) — 隐式学几何 + 传感器感知属性,免显式建网格

References

  • Tang, T., et al. (2023). LiDAR-NeRF: Novel LiDAR View Synthesis via Neural Radiance Fields. ACM MM 2024. arXiv:2304.10406 — 论文 (本笔记读 arXiv 全文整理)
  • NeRF 体渲染见 NeRF (G6-1);LiDAR 隐式 SLAM 见 NeRF-LOAM (G5-9) / LONER (G5-10)