今天要介绍的是密歇根大学和福特汽车公司联合组建的UM&Ford自动驾驶汽车中心(FCAV)。FCAV成立的初心是基于L4自动驾驶,利用纯虚拟数据来感知路况并决策规划,以加速自动驾驶汽车研究,探索更安全的自动驾驶和更广阔的汽车未来。
复杂城市交叉路口行人3D姿态度量估计的基准数据集
在2018年,FCAV首先发布了一项“复杂城市交叉路口行人3D姿态度量估计的基准数据集”。
这个数据集“PedX”是一种大型的复杂城市十字路口行人多模态集合。PedX由5000多对高分辨率(12MP)立体图像和激光雷达数据组成,并提供行人的2D和3D标签。同时,提出了一种新的3D模型拟合算法,用于不同模式和新形状和时间先验约束的自动3D标记。所有带注释的3D行人都被定位到真实空间中,生成的3D模型通过配置在受控室外环境中的mocap系统来模拟城市十字路口的行人进行验证。实验表明,先进的自动标签方法可以取代手工标记2D标签,从而促进大规模数据集的自动生成。
多辆车装配货物的路径选题方法
此后,FCAV验证了一种多辆车装配货物的路径选题方法(Multiple VehicleRouting Problem for Pickup and Delivery,MVPDP)。
该算法的目的是最小化在完成客户提货和交付任务时产生的运输成本。为此,该方法构建了一个新的0-1整数二次规划(IQP)问题来精确地求解MVPDP。与最先进的混合整数线性规划(MILP)问题的表述相比,本方法需要的约束和决策变量相对更少。为了确保MVPDP的IQP公式能够以计算有效的方式求解,还设计了一组充分条件。总而言之,通过实现验证,该方法具有比MILP更好的计算效率。
校准生成的合成图像
注:来自KITTI基准数据集(左上)、Cityscapes数据集(右上)、VirtualKITTI(左下)和Grand Theft Auto (右下)的图像比较。注意,每个数据集不同的颜色转换、亮度和细节。
对于生成合成图像,FCAV也做出了自己独特的贡献以改善真实和合成数据的深度视觉(ImproveVisual Learning from Synthetic Data,LVLSD)。研究人员通过研究摄像机建模以增加城市场景中学习视觉任务的训练数据的大小和可变性。然而,很少有人处理传感器领域的建模变化。传感器效应会降低真实图像的质量,在基于合成数据的训练和真实环境测试的视觉任务通用性上限制了网络性能。研究人员提出了一种有效的、自动的、基于物理的增强管道,用于改变合成图像的传感器效果色差、模糊、曝光、噪声和色温。特别地,本文说明了使用该管道对合成训练数据集进行扩充,可以减少城市驾驶场景中目标检测任务的合成域与真实域之间的域差。
在KITTI上测试的基线非增广数据(左)和我们提出的方法(右)的目标检测示例。蓝色方框显示正确的检测;红色框表示基线方法没有检测到,但是FCAV提出的基于传感器的图像增强方法检测到了。
本次介绍的密歇根大学和福特汽车公司联合组建的UM&Ford自动驾驶汽车中心(FCAV)也是在自动驾驶取得了令人瞩目的实验成果。FCAV成立的初心是基于L4自动驾驶,利用纯虚拟数据来感知路况并决策规划,以加速自动驾驶汽车研究,探索更安全的自动驾驶和更广阔的汽车未来。后续还将继续推送相关项目介绍。