具身智能体:单目深度估计算法

发布时间:2022-06-15 打印[ ]

项目状态:已开源-不断更新

项目内容:单目深度估计是3D视觉的基本任务之一,本项目分别从三维空间结构和算法实时性两个方面开展研究:

(1)为了提升深度精度与边缘精度,设计了边缘诱导-场景聚合网络,优化深度图,预测的场景最远区域并恢复正确的场景边缘。

(2)为了解决轻量级深度估计性能下滑严重的问题,设计深度分布对齐,通过多尺度区域交互恢复深度分布形态,并通过局部-全局训练策略约束场景值域。

项目效果:在深度值精度与边缘精度上保持领先,并在轻量级模型上,依旧保持性能领先。


相关论文成果和开源算法链接:

[1] Yihao Liu, Feng Xue, Anlong Ming*, SM4Depth: Seamless Monocular Metric Depth Estimation across Multiple Cameras and Scenes by One Model,  arXiv:2403.08556

[2] Fei Sheng, Feng Xue, Wenteng Liang, Yichong Chang, Anlong Ming*, Monocular Depth Distribution Alignment with Low Computationthe 2022 International Conference on Robotics and Automation (ICRA)2022. 

https://github.com/mRobotit/DANet

[3] Feng Xue, Junfeng Cao, Fei Sheng, Yankai Wang, Yu Zhou, Anlong Ming, Boundary-induced and Scene-aggregated Network for Monocular Depth PredictionPattern Recognition (PR), vol. 115,  2021.  
https://github.com/mRobotit/BS-Net


image.png