项目状态:已开源-不断更新
项目内容:单目深度估计是3D视觉的基本任务之一,本项目分别从三维空间结构和算法实时性两个方面开展研究:
(1)为了提升深度精度与边缘精度,设计了边缘诱导-场景聚合网络,优化深度图,预测的场景最远区域并恢复正确的场景边缘。
(2)为了解决轻量级深度估计性能下滑严重的问题,设计深度分布对齐,通过多尺度区域交互恢复深度分布形态,并通过局部-全局训练策略约束场景值域。
项目效果:在深度值精度与边缘精度上保持领先,并在轻量级模型上,依旧保持性能领先。
相关论文成果和开源算法链接:
[1] Yihao Liu, Feng Xue, Anlong Ming*, SM4Depth: Seamless Monocular Metric Depth Estimation across Multiple Cameras and Scenes by One Model, arXiv:2403.08556
[2] Fei Sheng, Feng Xue, Wenteng Liang, Yichong Chang, Anlong Ming*, Monocular Depth Distribution Alignment with Low Computation,the 2022 International Conference on Robotics and Automation (ICRA), 2022.
https://github.com/mRobotit/DANet
[3] Feng Xue, Junfeng Cao, Fei Sheng, Yankai Wang, Yu Zhou, Anlong Ming, Boundary-induced and Scene-aggregated Network for Monocular Depth Prediction, Pattern Recognition (PR), vol. 115, 2021.
https://github.com/mRobotit/BS-Net