通过传感器计算打造视觉雷达,下一代自动驾驶系统的关键构成

机器之心专栏
作者:鉴智机器人
2021年10月25日 , 特斯拉市值站上万亿美金 , 成为美股第五家市值破万亿的企业 , 几乎超过美股全部主要车企市值的总和 。 特斯拉在资本市场的成功 , 刺激着投资者的神经 , 也促使市场再一次将视野聚焦在自动驾驶领域 , 进一步思考自动驾驶技术路线的发展方向 。
本文希望从技术角度客观分析和回答以下问题:自动驾驶等级提升需要解决什么关键问题?怎样的自动驾驶方案更加具有实现大规模无人驾驶的可能性?自动驾驶作为现实世界的AI问题 , 难点在哪里?以上问题促使我们理性客观地思考该如何去实现自动驾驶——这一承载了太多期望、不断挑拨大众神经的技术生产力变革 , 从而推动行业冷静且务实地向前发展 。
1.自动驾驶的眼睛:基于高质量图像成像的视觉雷达
随着自动驾驶等级的不断提高 , 控制权和责任主体逐渐从驾驶员转换为车辆 , 智驾系统的定位也将由扩增人的感知能力到接管车辆自主驾驶 。 由此对智驾系统之于物理世界环境理解的要求完全不同 , 将由对物理世界部分信息的提取提升到事无巨细的全面感知与理解 。 而这种变化 , 首要就是对2D图像成像与3D建模的越来越高的要求:1)更高分辨率和环境适应度的2D图像成像;2)对物理世界准确且稠密的实时3D建模 。
Camera是自动驾驶感知物理世界最重要的传感器 , 其分辨率的提升将极大的提升图像的信息承载量 , 使得自动驾驶系统能够感知更加细节和更远距离的行车环境 。 当前主流自动驾驶前视摄像头的分辨率已经到800万像素以上 , 而更高的分辨率也是未来必然发生的事情 。 自动驾驶汽车面临的是一个开放性的外部环境 , 除了分辨率的提升 , 还需要提升自动驾驶在各种行车路况下的图像成像质量 , 比如不同的光线环境 , 傍晚、夜晚等 , 不同的气候环境 , 雨雪雾天等 。 相对于传统汽车应用的车载成像 , 自动驾驶对于车载成像质量的要求将极大提升 , 如何通过成像计算获取更高质量的图像就成为一个要解决的关键性问题 。
自动驾驶汽车在三维物理世界中运行 , 必然要求对物理世界进行更加深刻的三维理解 。 当前的高级别辅助驾驶在道路上不断出现各种各样的事故 , 这些事故的发生很大程度上是由于没有识别到未被样本库所覆盖的异形、非标等物体 , 比如一辆拉着一棵树的货车等 , 而这些cornercase是无法被穷尽的 。 对于行车环境的实时稠密3D建模不仅可以识别异形和非标等物体 , 还能判断路面坑洼与起伏 , 这无疑将大大提升自动驾驶的安全级别 。 当前自动驾驶的3D环境感知 , 主要依赖激光雷达等主动投射测量装置 , 但其在分辨率上远低于Camera , 也不具备颜色信息 。 随着深度学习的发展 , 单目深度估计、双目立体视觉、SFM、MVS等问题已经可以被深度神经网络所建模 , 从而可以基于多目视觉通过AI的方法实时生成3D点云 , 其视觉点云天然与图像对齐 , 并且其分辨率也能达到图像分辨率的级别 。 因此 , 如何通过多目视觉实现高分辨率的实时稠密3D建模 , 即视觉雷达 , 是另外一个要解决的关键性问题 。
视觉传感器的信息承载量极高 , 目前远未被充分挖掘 , 但无论2D图像成像还是实时稠密3D建模都需要强有力的算法和算力进行支撑 , 这需要算法和算力进行协同设计 。 视觉传感器+算力+算法的传感器计算模式 , 将更加本质的推动解决自动驾驶当前面临的关键问题 , 即从2D和3D层面对物理世界进行事无巨细的感知与理解 。
鉴智机器人核心团队拥有超过十年的图像处理、AI算法和算力设计的行业经验 , 将以视觉传感器为核心 , 通过解决车载ISP、视觉雷达等视觉传感器2D、3D成像的核心问题 , 打造更加强大的自动驾驶之眼 , 从而推动自动驾驶安全等级的提升 。