news 2026/2/2 2:24:56

NGD-SLAM(一)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
NGD-SLAM(一)

到最近几年,动态场景的处理才变成可能,这也是本文的一个亮点之一,当然你要说这篇论文有多创新那也算不上,估计这样的论文放到CVPR大概率不会被收纳,因为从学术研究的角度看,这篇论文还不够新颖,那这里为什么着重介绍这篇论文那?因为它在实际项目运用上很有价值。我们常常会看到很多新技术在研究领域获得了很高的评价,但在实际项目中却乏人问津。这实际上是科学研究和实际项目遵循两套完全不同的哲学。科学研究强调新颖性,创新性,而不强调实用价值,实际项目则常常只有有限的资源和条件,创新的技术需要做出很多取舍。在这个到处都在鼓吹“算力”的年代,新技术不使用GPU,多少有点另类,但这也突出了这个论文在非常有限的硬件条件下做出了不错的效果,这也是我非常喜欢这篇论文的原因。

下面讲解这篇论文如何实现在不使用GPU的情况下处理动态场景的问题。

3

论文主要通过两个方面实现上述目的:第一,关于动态场景部分遮罩的生成,因为论文使用YOLO模型进行动态物体的识别,这是个相对比较耗时的操作,所以这里使用上一帧生成的动态物体的包围盒,避免每一帧都进行YOLO计算带来的资源消耗。第二,在做相机跟踪的时候,对于非关键桢采用光流的方法,而对于关键桢使用ORB特征点的方式进行计算,这样可以减少计算量,并且有很好的鲁棒性。

4

如图所示,在DETECTION阶段YOLO模型生产动态物体的包围盒,在SEGMENTATION阶段利用深度信息对包围盒进行细化的分割,SAMPLING对于分割的区域进行15*15的点提取,TRACKING则使用Lucas-Kanade光流法对这些特征点进行跟踪,CLUSTERING对outlier进行剔除,最后一步PREDICTION完成遮罩的预测。

5

对比光流法和ORB特征跟踪法的区别。对于上一帧没出现而当前帧出现的动态人物,ORB不能正确的识别。

最后谈一下该论文的一些限制。论文在计算遮罩的时候需要用到深度信息,所以使用的图片源为RGB-D,这就需要对于单目相机或者立体

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/1/23 22:21:20

球类运动场景中的多目标检测与追踪_基于yolo13-C3k2-HDRAB模型实现

1. 球类运动场景中的多目标检测与追踪_基于YOLO13-C3k2-HDRAB模型实现 🎾 目标检测作为计算机视觉领域的核心任务之一,旨在从图像或视频中识别并定位特定类别的目标物体。深度学习技术的兴起为目标检测领域带来了革命性的突破,使其在准确率、…

作者头像 李华
网站建设 2026/1/27 13:14:32

18、高级实用工具概述:SELinux与Firewalld深度解析

高级实用工具概述:SELinux与Firewalld深度解析 1. SELinux基础与模式切换 SELinux(Security-Enhanced Linux)是一种增强型的安全机制,它在用户设置的自由访问控制之外提供了重要的安全层。目标策略规则允许以 httpd_t 运行的进程访问具有 httpd_sys_content_t 上下文的…

作者头像 李华
网站建设 2026/2/1 11:45:13

前端引用printJS打印

1. 引入 PrintJS下载或 CDN 引入&#xff1a;CDN 方式&#xff1a;在 HTML 文件的 <head> 标签中&#xff0c;通过 CDN 链接引入 PrintJS 的 CSS 和 JavaScript 文件。<head><link href"https://printjs - 4de6.kxcdn.com/print.min.css" rel"st…

作者头像 李华
网站建设 2026/2/1 10:20:03

python的iloc用法

口诀 .iloc[行位置, 列位置] 只看整数下标&#xff0c;从左到右从 0 开始数 练习 1.调试打印前 8 行&#xff08;只看前 10 列&#xff09; for i in range(8):print(df_raw.iloc[i, :10].tolist())写法含义df.iloc[r, c]单个标量df.iloc[r1:r2, c1:c2]连续块&#xff08;切片&…

作者头像 李华