目标检测：ECCV 2020附代码论文合集

2020-08-20 10:54

学术头条

关注

遥感旋转目标检测

1 Arbitrary－Oriented Object Detection with Circular Smooth Label

作者：Yang Xue，Yan Junchi

机构：上海交通大学

简介：任意方向的目标检测由于在航空图像、场景文本、人脸等方面的重要性，近年来在视觉领域引起了越来越多的关注。本文研究了现有的基于回归的旋转检测器存在边界不连续的问题，这是由角周期性或角点排序直接引起的。通过仔细研究，作者发现其根本原因是理想的预测超出了规定的范围。作者设计了一个新的旋转检测基线，通过将角度预测从回归问题转化为一个精度损失很小的分类任务来解决边界问题，与以往使用粗粒度旋转检测的工作相比，设计了高精度的角度分类。他们还提出了一种圆形平滑标签（CSL）技术来处理角度的周期性，并增加了对相邻角的误差容限。进一步介绍了CSL中的四个窗口函数，并探讨了不同窗口半径对检测性能的影响。对DOTA、HRSC2016以及场景文本数据集ICDAR2015和MLT进行了大量的实验和可视化分析，证明了该方法的有效性。

目标检测：ECCV 2020附代码论文合集

3D目标检测

1 Rethinking Pseudo－LiDAR Representation

作者：Xinzhu Ma，Shinan Liu，Zhiyi Xia，Hongwen Zhang，Xingyu Zeng，Wanli Ouyan

机构：悉尼大学，商汤科技

简介：最近提出的基于伪激光雷达的三维探测器大大提高了单目／立体三维探测任务的基准。然而，研究界对其潜在的机制仍不甚清楚。本文对伪激光雷达的数据表示进行了深入研究，发现伪激光雷达表示的有效性来自于坐标变换，而不是数据表示本身。在此基础上，作者设计了一种基于图像的CNN探测器Patch－Net，它是一种更通用的、可以实例化为基于伪激光雷达的3D探测器。此外，本文的PatchNet中的伪激光雷达数据被组织为图像表示，这意味着现有的2D CNN设计可以很容易地用于从输入数据中提取深层特征并提高3D检测性能。作者在具有挑战性的KITTI数据集上进行了大量的实验，其中提出的PatchNet优于所有现有的基于伪激光雷达的同类产品。

目标检测：ECCV 2020附代码论文合集

2 Pillar－based Object Detection for Autonomous Driving

作者：Yue Wang，Alireza Fathi，Abhijit Kundu，David Ross，Caroline Pantofaru，Tom Funkhouser，Justin Solomon

机构：MIT，Google

简介：本文提出了一种简单灵活的自动驾驶目标检测框架。在观察到该应用中的点云非常稀疏的基础上，提出了一种实用的基于柱的方法来解决锚定引起的不平衡问题。特别地，本文的算法在多视点特征学习中加入了柱面投影，预测了每个柱而不是每个点或每个锚点的边界盒参数，并且包含了一个对齐的柱到点投影模块来提高最终预测。本文的无锚方法避免了与以往方法相关的超参数搜索，简化了三维目标检测，同时显著提高了最先进的水平。

目标检测：ECCV 2020附代码论文合集

3 EPNet： Enhancing Point Features with Image Semantics for 3D Object Detection

作者：Tengteng Huang，Zhe Liu，Xiwu Chen，Xiang Bai

机构：华中科技大学

简介：本文针对三维检测任务中的两个关键问题，即多传感器（即LiDAR点云和相机图像）的开发以及定位和分类置信度之间的不一致性。为此，作者提出了一种新的融合模块，在不需要任何图像注释的情况下，对具有语义特征的点特征进行逐点增强。此外，使用一致性强制损失来明确鼓励本地化和分类可信度的一致性。作者设计了一个端到端的可学习框架EPNet来集成这两个组件。在KITTI和SUN－RGBD数据集上进行的大量实验证明了EPNet优于最先进的方法。

目标检测：ECCV 2020附代码论文合集

视频目标检测

1 Learning Where to Focus for Efficient Video Object Detection

作者：Zhengkai Jiang，Y． Liu，Ceyuan Yang，Jihao Liu， Peng Gao，Qian Zhang，Shiming Xiang，C． Pan

机构：腾讯

简介：将现有的基于图像的检测器转移到视频中是非常重要的，因为部分遮挡、罕见姿势和运动模糊会导致帧质量下降。以前的方法利用光流翘曲在视频帧间传播和聚集特征。然而，直接将图像级光流应用于高层特征可能无法建立精确的空间对应关系。为此，提出了一种新的可学习时空采样（LSTS）模块来准确地学习相邻帧特征之间的语义级对应关系。首先对采样点进行随机初始化，然后迭代更新，在检测监督的指导下逐步寻找更好的空间对应关系。此外，还分别引入稀疏递归特征更新（SRFU）模块和密集特征聚合（DFA）模块来建模时间关系和增强每帧特征。该方法在imagenetvid数据集上实现了最先进的性能，计算复杂度和实时速度都很低。

目标检测：ECCV 2020附代码论文合集