目标检测:ECCV 2020附代码论文合集
遥感旋转目标检测
1 Arbitrary-Oriented Object Detection with Circular Smooth Label
作者:Yang Xue,Yan Junchi
机构:上海交通大学
简介:任意方向的目标检测由于在航空图像、场景文本、人脸等方面的重要性,近年来在视觉领域引起了越来越多的关注。本文研究了现有的基于回归的旋转检测器存在边界不连续的问题,这是由角周期性或角点排序直接引起的。通过仔细研究,作者发现其根本原因是理想的预测超出了规定的范围。作者设计了一个新的旋转检测基线,通过将角度预测从回归问题转化为一个精度损失很小的分类任务来解决边界问题,与以往使用粗粒度旋转检测的工作相比,设计了高精度的角度分类。他们还提出了一种圆形平滑标签(CSL)技术来处理角度的周期性,并增加了对相邻角的误差容限。进一步介绍了CSL中的四个窗口函数,并探讨了不同窗口半径对检测性能的影响。对DOTA、HRSC2016以及场景文本数据集ICDAR2015和MLT进行了大量的实验和可视化分析,证明了该方法的有效性。
3D目标检测
1 Rethinking Pseudo-LiDAR Representation
作者:Xinzhu Ma,Shinan Liu,Zhiyi Xia,Hongwen Zhang,Xingyu Zeng,Wanli Ouyan
机构:悉尼大学,商汤科技
简介:最近提出的基于伪激光雷达的三维探测器大大提高了单目/立体三维探测任务的基准。然而,研究界对其潜在的机制仍不甚清楚。本文对伪激光雷达的数据表示进行了深入研究,发现伪激光雷达表示的有效性来自于坐标变换,而不是数据表示本身。在此基础上,作者设计了一种基于图像的CNN探测器Patch-Net,它是一种更通用的、可以实例化为基于伪激光雷达的3D探测器。此外,本文的PatchNet中的伪激光雷达数据被组织为图像表示,这意味着现有的2D CNN设计可以很容易地用于从输入数据中提取深层特征并提高3D检测性能。作者在具有挑战性的KITTI数据集上进行了大量的实验,其中提出的PatchNet优于所有现有的基于伪激光雷达的同类产品。
2 Pillar-based Object Detection for Autonomous Driving
作者:Yue Wang,Alireza Fathi,Abhijit Kundu,David Ross,Caroline Pantofaru,Tom Funkhouser,Justin Solomon
机构:MIT,Google
简介:本文提出了一种简单灵活的自动驾驶目标检测框架。在观察到该应用中的点云非常稀疏的基础上,提出了一种实用的基于柱的方法来解决锚定引起的不平衡问题。特别地,本文的算法在多视点特征学习中加入了柱面投影,预测了每个柱而不是每个点或每个锚点的边界盒参数,并且包含了一个对齐的柱到点投影模块来提高最终预测。本文的无锚方法避免了与以往方法相关的超参数搜索,简化了三维目标检测,同时显著提高了最先进的水平。
3 EPNet: Enhancing Point Features with Image Semantics for 3D Object Detection
作者:Tengteng Huang,Zhe Liu,Xiwu Chen,Xiang Bai
机构:华中科技大学
简介:本文针对三维检测任务中的两个关键问题,即多传感器(即LiDAR点云和相机图像)的开发以及定位和分类置信度之间的不一致性。为此,作者提出了一种新的融合模块,在不需要任何图像注释的情况下,对具有语义特征的点特征进行逐点增强。此外,使用一致性强制损失来明确鼓励本地化和分类可信度的一致性。作者设计了一个端到端的可学习框架EPNet来集成这两个组件。在KITTI和SUN-RGBD数据集上进行的大量实验证明了EPNet优于最先进的方法。
视频目标检测
1 Learning Where to Focus for Efficient Video Object Detection
作者:Zhengkai Jiang,Y. Liu,Ceyuan Yang,Jihao Liu, Peng Gao,Qian Zhang,Shiming Xiang,C. Pan
机构:腾讯
简介:将现有的基于图像的检测器转移到视频中是非常重要的,因为部分遮挡、罕见姿势和运动模糊会导致帧质量下降。以前的方法利用光流翘曲在视频帧间传播和聚集特征。然而,直接将图像级光流应用于高层特征可能无法建立精确的空间对应关系。为此,提出了一种新的可学习时空采样(LSTS)模块来准确地学习相邻帧特征之间的语义级对应关系。首先对采样点进行随机初始化,然后迭代更新,在检测监督的指导下逐步寻找更好的空间对应关系。此外,还分别引入稀疏递归特征更新(SRFU)模块和密集特征聚合(DFA)模块来建模时间关系和增强每帧特征。该方法在imagenetvid数据集上实现了最先进的性能,计算复杂度和实时速度都很低。
AMiner 会议智图开放平台 ECCV 2020 专题了解会议的精彩内容,其内容包括论文、作者、华人学者、一作华人学生、论文 PPT 和视频等多维分析服务,是参会学者的会议智能助理。

最新活动更多
-
3月27日立即报名>> 【工程师系列】汽车电子技术在线大会
-
即日-4.22立即报名>> 【在线会议】汽车腐蚀及防护的多物理场仿真
-
精彩回顾立即查看>> 【在线会议】汽车检测的最佳选择看这里
-
精彩回顾立即查看>> 2024工程师系列—工业电子技术在线会议
-
精彩回顾立即查看>> 【线下论坛】华邦电子与莱迪思联合技术论坛
-
精彩回顾立即查看>> 【线下论坛】华邦电子与恩智浦联合技术论坛
推荐专题
- 1 HD4850神迹重现!RX 9070 XT首发评测
- 2 RTX 5070海外评测:有史以来最糟糕70显卡、NVIDIA说谎
- 3 650亿美元,Meta开始押注下一个硬件
- 4 RTX 5070首发评测:DLSS 4提升超4倍!4K游戏不再是高端玩家专属
- 5 游戏和生产力第一次同时最强!锐龙9 9950X3D首发评测
- 6 技嘉RTX 5070超级雕评测:DLSS 4让中端显卡也有顶级游戏体验
- 7 iGame RTX 5070 Ultra W OC 12GB首发评测
- 8 CPU超越14900HX、核显强于4060!ROG幻X 2025评测
- 9 影驰RTX 5070 Ti金属大师白金版OC评测:全新设计 颜值也追上性能和做工
- 10 联想AI PC的生死时速
发表评论
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论