自动驾驶|「专利解密」多AI模型联合识别算法 百度为自动驾驶又添一新技术

【嘉勤点评】百度发明的联合多种AI模型进行图像识别的方案中,包含有搭载多种AI模型的AI芯片,可以同时对图像完成多种任务的识别。通过将这些识别子结果整合起来并生成最终的识别结果,不仅可以提高图像识别的精度,还提高了图像的识别效率。
集微网消息,在近日的NVIDIA GTC大会上,英伟达正式宣布,百度第三代自动驾驶平台ACU(Apollo Computing Unit)产品“三鲜”将搭载NVIDIA DRIVE Orin SoC(系统级芯片)。
百度的自动驾驶技术目前位于国内的第一梯度,而在自动驾驶技术中,有一种技术是“图像+AI”的基本功,即图像识别。图像识别是指对图像进行处理、分析和理解,以识别各种不同模式的目标和对象的技术。
目前,为了节省云端服务器的计算压力和传输带宽,会在靠近数据源头的一侧直接对图像进行计算,即边缘计算。在基于深度学习的边缘计算的图像识别场景下,图像识别系统通常部署单个人工智能(AI)芯片,以及单个AI芯片连接的集成电路芯片。
具体而言,单个AI芯片运行图像识别过程中的所有深度学习模型,对集成电路芯片采集的图像进行图像识别,以得到图像的识别结果,并将图像的识别结果发送至云端服务器,以进行下一步处理。
而百度也在2019年4月30日申请了一项名为“用于识别图像的方法和系统”的发明专利(申请号:201910362134 .0),申请人为百度时代网络技术(北京)有限公司。
在该专利中,发明了一种联合多种AI模型进行图像识别的方案,根据该专利目前公开的相关资料,让我们一起来看看这项技术方案吧。
自动驾驶|「专利解密」多AI模型联合识别算法 百度为自动驾驶又添一新技术
文章插图
如上图,为该专利中发明的用于识别图像的系统的系统架构示意图,在该架构中,主要包括集成电路芯片101和AI芯片集合102,并且二者互相连接。其中,AI芯片集合包括至少两个AI芯片,且其中的AI芯片也相互之间并行连接,如上图中所示的AI芯片1021、1022。并且,该专利中提及,该方案可根据用户的具体需求并联任意数目的AI芯片。
集成电路芯片可以与AI芯片集合交互,完成接收或者发送信息的任务。例如,集成电路芯片采集图像后,将图像发送至AI芯片集合,AI芯片集合可以对图像进行图像识别,以生成两个识别子结果,并将结果发送至集成电路芯片。最终,在集成电路芯片中,可以整合这两个识别子结果生成最终的识别结果。
自动驾驶|「专利解密」多AI模型联合识别算法 百度为自动驾驶又添一新技术
文章插图
如上图,为应用于上述架构中的图像识别方案的流程图,当系统接收到集成电路芯片发送的图像后,会对图像进行识别,并且由AI芯片集生成多个识别子结果。在集成电路中,搭载有图像采集的传感器以及专门用于高清图像传输的SOC。
而在AI芯片集中,每个AI芯片可以运行图像识别过程中的所有深度学习模型,通过对图像的分割得到子图像集合,并将这些子图像分发给AI芯片集合中的AI芯片进行图像识别。通过汇总每个AI芯片的识别子结果,就可以得到图像的识别结果。
此外,在AI芯片集中,为了确保计算时间消耗最优,以达到计算性能最优的效果,一个复杂度较高的业务对应的深度学习模型可以单独运行在一个AI芯片上,同时,多个复杂度较低的业务对应的深度学习模型也可以同时运行在一个AI芯片上,以此均衡每个AI芯片的计算任务量,使得每个AI芯片的计算时间相近。
自动驾驶|「专利解密」多AI模型联合识别算法 百度为自动驾驶又添一新技术
文章插图
最后,我们来看看该专利中为上述图像识别方法构建的应用场景示意图,其中包含有两个并联的AI芯片,系统级芯片与转换芯片分别与云端服务器相连。在系统级芯片中,可以完成人脸图像采集的任务,并将该人脸图像转换为BT信号411发送给转换芯片。