自动驾驶数据长尾分布问题:利用有世界先验的视频生成模型合成数据实践
本文记录了一次面向自动驾驶长尾数据问题的合成数据实验。针对真实数据中小动物横穿等低频目标样本不足的问题,尝试利用具备世界先验的视频生成模型,从真实道路图像出发生成小狗横穿场景,再通过抽帧构建候选训练样本。实验结果表明,相比传统贴图式合成,视频生成模型在接地关系、尺度、透视和运动连续性上更接近真实采集数据。后续工作将继续探索自动清洗、自动标注和真实验证集上的 Recall / mAP 评估。
11
|
0
自动驾驶数据长尾分布问题:利用有世界先验的视频生成模型合成数据实践
自动驾驶多传感器融合建图:一次 IEKF-GNSS-LiDAR 排障实验的工程记录
2026-06-03
2026-06-03
接手一个 LiDAR-IMU-GNSS 建图系统,轨迹跟 GNSS 对不上。花一天排查:观测回调没注册、6-DOF 强约束拖歪姿态、1.4米杆臂补偿反致建图炸掉、坐标系对齐三组实验均未完全解决。一次排障记录。
7
|
0
自动驾驶多传感器融合建图:一次 IEKF-GNSS-LiDAR 排障实验的工程记录
4090 工作站软件维修记录
2026-05-22
2026-06-04
一次 Ubuntu 工作站维修的完整记录:从显示器无信号开始,经历 Safe Graphics 卡死、20.04/22.04 反复安装失败、绕路 Server 安装器、定位 fjes 冷门内核模块导致 udev 死锁、解决 GDM 启动慢与网络栈混乱,到最后发现热重启 kernel panic 并更换 HWE 6.8 内核。典型的洋葱式排障——一个问题解决之后,下一个问题才会露出来。
3
|
0
4090 工作站软件维修记录
如何通过图像中已知角点坐标反求相机位置:PnP外参估计实践
2026-05-15
2026-06-02
已知相机内参,已知场景中几个点的 3D 坐标,从图像中找到这些点的像素位置,求解相机在三维世界中的位姿——这就是 Perspective-n-Point(PnP)问题。本文涉及的工具已开源。
3
|
0
如何通过图像中已知角点坐标反求相机位置:PnP外参估计实践
从四路鱼眼到鸟瞰图:BEV 环视原理与 surround-view-system-introduction 工程精读
2026-05-12
2026-06-02
本文围绕开源工程 [surround-view-system-introduction](https://github.com/neozhaoliang/surround-view-system-introduction),分享了相关知识记录
15
|
0
从四路鱼眼到鸟瞰图:BEV 环视原理与 surround-view-system-introduction 工程精读
鱼眼相机也能做双目测距?——双鱼眼深度估计探索
两个鱼眼相机虽然畸变大、不水平对齐、光轴不平行,但如果它们有固定基线和明显的重叠视野,能否构成一个非标准的双目立体对来做三角化测距? 答案是可行的。本文记录完整的探索过程、实验结果和工程经验。 本文涉及的部分代码已开源在 GitHub。
2
|
0
鱼眼相机也能做双目测距?——双鱼眼深度估计探索
相机标定入门:内参、外参、畸变与棋盘格标定
相机标定是计算机视觉的"第一公里"。 这篇文章从工程视角出发,解释四个问题: 1. 相机怎么把三维世界拍成二维图像?(针孔模型) 2. 为什么图像会有畸变?怎么描述这种畸变? 3. 内参和外参分别代表什么?它们之间是什么关系? 4. 棋盘格标定到底在算什么?重投影误差怎么看?
44
|
0
相机标定入门:内参、外参、畸变与棋盘格标定
LeHome Challenge @ ICRA 2026 个人参赛复盘
2026-05-10
2026-05-29
本文记录了我以个人身份参加 ICRA 2026 LeHome Challenge 的完整过程。从环境搭建、数据准备,到 ACT / Diffusion Policy / SmolVLA / pi0.5 四条技术路线的尝试与取舍,再到最终方案的选择与提交。重点不是晒成绩,而是记录真实参赛者在有限时间和资源下的路线决策过程与工程踩坑经历。
49
|
0
LeHome Challenge @ ICRA 2026 个人参赛复盘
Scaling 的力量与边界:LeHome SmolVLA 从 30k 到 90k 的训练复盘
2026-04-30
2026-05-10
在 30k baseline 提交之后,我继续对 SmolVLA 进行 scale:从 30k → 50k → 70k → 90k 逐步加训,每阶段评测四类衣物的效果。本文详细对比 70k 和 90k 在四类任务上的完整评测结果,记录"为什么明明 90k 多训了 20k 步,最终却选了 70k",以及我对 scaling 在这个任务上演化趋势的观察。
4
|
0
Scaling 的力量与边界:LeHome SmolVLA 从 30k 到 90k 的训练复盘
LeHome 尝试 pi0.5:依赖地狱、LoRA 微调与截止前的放弃
2026-04-26
2026-05-10
我试图用 pi0.5 冲一波分。结果一头扎进了依赖地狱:LeRobot pi0.5 需要特定版本的 transformers(4.53.2,不是 4.57.6)、需要 OpenPI 的 `transformers_replace` 补丁、需要 Hugging Face token 授权 paligemma 模型。本文记录完整的排障过程、LoRA 微调训练(sanity check → 30k → 150k → 270k)、以及最终"初具人形但依旧悬空"的评测效果。在截止前未能得到可用结果,pi0.5 最终未作为主力方案。
61
|
0
LeHome 尝试 pi0.5:依赖地狱、LoRA 微调与截止前的放弃
1
2 3 4