借力算法,海天瑞声驾驭自动驾驶“新引擎”( 三 )


例如 , WaymoOpenDataset有16.7个小时的视频数据 , 3,000个驾驶场景 , 60万视频帧 , 将近200万3D多边形和2200万2D多边形标注 , 而这只是Waymo大量私有自动驾驶数据集的一小部分 。
快速变化的市场环境 , 对数据交付工期的要求也更为苛刻 , 只有更加自动化、智能化、平台化的数据服务 , 才能更好地满足客户需求 。
作为浸润行业十几年的头部服务商 , 海天瑞声从成立之初 , 就在摸索各环节人机协作的可能 , 实现数据标注服务质量、速度和规模化的最佳平衡 。
借力算法,海天瑞声驾驭自动驾驶“新引擎”
文章图片
一体化数据处理平台示意图
其十多项核心技术应用于训练数据生产的设计、采集、加工、质检中 , 自主研发一体化数据处理平台 , 将项目流程管理、质量把控、数据安全管理融入其中 , 并嵌入上千款自主开发积累的 , 适用于各种业务场景训练数据处理需求的工具 , 充分提高了数据训练的生产效率与质量控制水平 。
具体到自动驾驶场景 , 一般人眼中 , 3D点云只是一片点状物 , 很难直观看出具体是什么 。 但资深标注员会就同一个连续帧的前、后几帧来回看 , 有时还会搭配2D图片一起看 , 「脑补」点云数据无法呈现的部分 。
海天瑞声自动驾驶标注平台有一个叫做「辅助构建物体脑补框」的工具 , 能帮助标注员进行更为精确的「脑补」 。 比如 , 拉框后 , 系统会自动就同一个连续帧的前、后几帧内容进行预判 , 还会给出一些诸如车辆大小的参考 。