iPhone|发布8 Gen 2,高通要夺回移动AI最强芯片的王座( 二 )


在 Hexagon 之后 , 真正的 AI 协处理器功能则由 8G2 上的另一个模块 Sensing Hub 来完成 。
别小看它:麻雀虽小 , 五脏俱全 , 它实际上内置了两颗 AI 协处理单元和一颗 DSP , 并且内存相较 8G1 增加了50% 。
Sensing Hub 的主要功能 , 是以更低的功耗来完成一些常规的传感识别和简单算法任务 , 比如传感器(面部、眼部识别、眼球追踪、生物验证、运动检测、手势识别)和语音控制(虚拟助手等) 。
在实际使用中 , Hexagon+Sensing Hub 能够在更低的功耗基础上 , 驱动更多更复杂的基于 AI 的功能 , 比如语音识别、离线翻译、自动字幕、游戏 AI 等 。
在本次骁龙技术峰会上 , 高通也宣布将会持续更新改进 Qualcomm AI Stack(AI 开发工具包) , 为移动开发者提供更多更好的工具 , 帮助他们开发出即便在手机平台上也具有超高性能和优秀体验的下一代 AI 移动应用 。
AI 计算参数表(节选):
异构融合 AI 加速器架构 Tensor 加速器 矢量扩展 Scalar 加速器 Micro Tile Inferencing 支持 Hexagon 直连技术 支持 INT8+INT16 混合精度 支持 INT4、8、16、FP16 单精度 计算式摄影:要跟谷歌掰手腕 在谷歌引领了计算式摄影(computational photography , 也即重度依靠算法优化的摄影技术)太多年之后 , 高通这次终于追了上来 , 要和谷歌一较高下了 。
在图像信号处理部分 , 8G2 芯片搭载的是最新一代的高通 Spectra 图像处理单元 。
高通给它起了一个很玄学的名字 , 叫做“认知 ISP”(Cognitive ISP) 。
这是因为在 8G2 上 , ISP 可以和前面提到的 AI 处理器通过 Hexagon Direct Link 技术实现直连(下图) , 从而在拍照和视频录制功能上 , 实现完全实时的 AI 优化效果 。
以拍照为例:8G2 可以在拍照取景的时候 , 实时进行物体识别和语义分割 (semantic segmentation) 过滤 , 如下图 。
简单来说 , 实时语义分割的意思就是手机在拍照取景时就已经知道画面中的场景长什么样 , 有哪些物体(人、动物、物品、背景等) , 对其进行准确的分割 , 并且根据训练好的算法进行分别优化 。
高通的原文是这样说的:有了这项技术 , 你的手机相机可以理解画面中的‘语境’ , 能够准确分辨人脸、面部细节、头发、衣服、天空等物体——并且每一项物体都能够得到适合它自己的优化 。
实施语义分割示意图 图片来源:高通
这一技术可以实现多种照片美化效果 , 包括并不限于更精准的背景虚化 , 更高的画面包容度(高对比度空间) , 或者在不影响背景颜色/锐度的前提下 , 实现人脸肤色优化或柔化等等 。
高通方面透露 , 实时语义分割过滤支持照片、录像模式 , 并且支持在屏幕取景时实时预览 。
8G2 处理器的 ISP 还将支持最多三摄像头最高各3600万像素同时拍照 。 这一能力的意义 , 在于后期通过多帧融合技术 , 显著增强单张照片的细节清晰度 , 并且让更高倍率的数码变焦/超分辨率(super-resolution)效果成为可能 。
另外高通透露 , 其它手机拍照技术大厂的最新技术 , 也已经面向 8G2 处理器优化:包括索尼的四重交织 (quad overlap) HDR 成像技术 , 以及三星开发的行业首枚2亿像素传感器 ISOCELL HP3 等 。
在过去相当长一段时间以来 , 谷歌 Pixel 系列手机一直被视为计算式摄影的最强产品 。 甚至其照片特有的高对比度空间、颜色风格的组合 , 在行业里被称为“Pixel look” 。
而与此同时 , 其它 OEM 由于采用的硬件、调校风格不同 , 拍照风格千奇百怪 , 效果时好时坏 , 稳定性欠佳 , 结果就是没有一个能够和谷歌的 Pixel look 相提并论 。