通过传感器计算打造视觉雷达,下一代自动驾驶系统的关键构成( 三 )
文章图片
图2:鉴智机器人视觉雷达Roadmap
2自动驾驶的大脑:全流程数据驱动的强单车智能
自动驾驶的大脑负责从感知到决策的驾驶全流程 , 也是自动驾驶最复杂、最核心和难度最高的部分 。 传统的以规则为核心的软件1.0工程化系统 , 在可维护性、扩展性和进化性上都具有一定的局限性 。 以AI和软件2.0为核心 , 全流程数据驱动的感知、预测、规控算法和强单车智能的解决方案 , 无疑是实现大规模无人驾驶更可行的方案 。
鉴智机器人核心团队在AI算法和应用、软件2.0的基础设施、数据驱动的大规模实践上拥有丰富的经验 , 将通过全流程数据驱动的自动驾驶大脑 , 建立强单车智能 , 从而降低对外部基础设施的依赖 , 更加利于自动驾驶的复制与推广 。
2.1深度学习带来的2D感知技术突破
感知是自动驾驶获取信息的第一步,所谓感知是指通过摄像头或其他传感器识别所看到的物体并理解该物体是什么 , 这对自动驾驶是至关重要的环节 。 自动驾驶车辆首先是要识别车道线 , 然后还要识别红绿灯、标志牌 , 除此之外就是识别障碍物比如前后左右有没有车辆 , 有没有行人 , 才能够进一步规划行驶路线 。
过去十年是人工智能技术的黄金十年 , 深度学习改变了计算机视觉整个领域 , 也带来了2D感知各个方向技术的突破 。 2D感知主要有图像分类、图像(物体)识别、细粒度识别(人脸识别)等方向 , 所采用的技术也从最早的模板匹配、线性分类到现在所广泛使用的深层卷积神经网络 , 再到最近刷新各大视觉任务榜单的Transformer 。 随着硬件计算能力的不断提升、算法范式的不断改进、可利用数据资源的不断增长 , 基于摄像头的2D感知已经成为了乘用车智能驾驶的主流方案 , 同时也成为了很多解决方案的核心差异点 。
鉴智机器人核心团队在国内最早基于深度学习在2D视觉感知各个方向开展系统性研究和大规模落地应用 , 在众多全球最具影响力的2D感知AI比赛和评测中获得冠军 , 发表顶级会议和期刊论文几十余篇 , 在多个业务领域实现了人工智能2D感知技术的大规模应用落地 。
图3:鉴智机器人在2D感知方向具有世界一流的核心能力
2.2从2D感知到4D感知
如果说2D感知还是在平面上检测、识别、分割物体 , 那么加入深度信息后 , 基础的2D感知即转化为3D感知 。 如果进一步在3D的基础上加入时间这一维度 , 进化得到的则是4D感知 。 在自动驾驶领域 , 4D感知可以完整且连续的探测车辆周围的物体 。
基于深度学习和三维视觉技术不断发展 , 随着CostVolume、OpticalFlow、differentiableHomography、Transformer等技术的成熟 , 以及多传感器融合、众包重建、稠密重建、自动标注等方向不断发展 , 可以高效率的提供高质量、大规模的4D场景数据 , 端到端的4D感知正在成为技术趋势 。 相比于传统的2D感知+后融合的方案 , 端到端的4D感知拥有很多优势 , 可以解决测距抖动较大、多摄像头拼接不准确、时序结果不稳定、迭代效率较低等一系列问题 。
更进一步 , 基于端到端的4D感知 , 可以进行更好的4D预测 , 一方面可对于交通参与者进行更优的运动轨迹预测 , 从而实现性能更加优异的规划控制;另一方面可对于道路行驶区域预测更加精细的3D结构化信息 , 在线生成局部实时3D地图 , 降低对高精地图等基础设施的依赖 。
文章图片
图4:鉴智机器人针对复杂路口驾驶场景的4D感知结果
- 计算|雄安城市计算(超算云)中心主体结构封顶
- 传感器|称年轻,我们怎么做到经济自由?
- 封顶|雄安新区:城市计算(超算云)中心提前完成主体结构封顶
- 封顶|雄安新区:城市计算(超算云)中心提前完成主体结构封顶
- LG电子正式加入IBM量子网络,将推动量子计算工业应用发展
- 联想|司马南没告诉你们,当年联想的使命根本不是研发,而是赚钱养计算所
- 近期|新的起点,新的征程|诺丰NFION顺利通过IATF16949
- 流量计费|铜管型母线的载流量计算
- 政企|AWS、阿里云、Azure 云计算三巨头的“混战”
- 网贷平台|网贷平台为啥不担心你还不上?对方早就计算清楚了