寒武纪|寒武纪:等待下一个爆发期( 二 )


市场只会留给有准备的人 。 寒武纪作为初创企业 , 对客户需求的把握也精细到全流程跟进 。 比如思元370 , 不仅可以作为推理芯片 , 也可以作为训练芯片使用 。 这样做的好处不仅是寒武纪自己的产品能够兼顾训练与推理 , 也方便客户全流程的模型部署、业务落地 。
实际上 , 今年1月寒武纪发布的首颗训练芯片思元290 , 在训练为主的同时也可以进行推理 。 借助Cambricon Neuware软件栈提供的软件及应用生态 , 就可以在思元290芯片上实现图形图像、语音、NLP、搜索推荐等多种应用的训练和推理 。
此次思元370发布 , Cambricon Neuware进一步整合了训练和推理的全部底层软件栈 , 包括底层驱动、运行时库、算子库以及工具链等 , 将MagicMind和深度学习框架Tensorflow、Pytorch深度融合 , 实现训推一体 。 依托于训推一体 , 在寒武纪全系列计算平台上 , 从云端到边缘端 , 用户均可以无缝地完成从模型训练到推理部署的全部流程 , 进行灵活的训练推理业务混布和潮汐式的业务切换 , 加快了用户端到端业务落地的速度 , 减少模型训练研发到模型部署之间的繁琐流程 , 可快速响应业务变化 , 提升算力利用率 , 降低运营成本 。

推理加速引擎MagicMind是寒武纪软件栈Cambricon Neuware全新升级的重要组成部分
图源:企业官网
在巨大的市场需求推动下 , 技术进步也愈加快速 , 硬件上翻倍甚至更多倍的增长比比皆是 。 比如今年1月发布的思元290 , 相比思元270就实现峰值算力提升4倍、内存带宽提高12倍、芯片间通信带宽提高19倍 。
但硬件强只是起步 , AI芯片企业更需要软件强 。 比如英伟达在AI芯片领域的强大 , 除了硬件性能之外 , 也因为其CUDA生态已经成为众多人工智能开发者主流选择 , 从而为自己造就了一条护城河 。 初创企业 , 同样需要建立自己的生态护城河 。
云、边、端、车四位一体布局中的寒武纪优势AI芯片龙头的优势 , 毋庸讳言 。 而寒武纪在最新的布局中 , 也显现出一家创业企业的独特优势 。
在今年7月举办的2021世界人工智能大会上 , 寒武纪首次披露了控股子公司行歌科技的进展 , 并披露研发中的车载智能芯片关键数据——基于7纳米制程的车规级芯片 , 算力大于200TOPS , 具备独立安全岛及成熟软件工具链 。
据中国汽车工业协会数据 , 2020年中国汽车销量为2531.1万辆 。 假如未来10年汽车销量的规模继续维持在2500万辆左右 , 智能汽车渗透率能够达到50% , 车载智能芯片单车价值达到5000元 , 那就是高达625亿元的市场规模 。 只是现在这一市场可能还不够大 , 但未来整个智能驾驶系统的市场规模一定会堪比手机SOC、云端AI芯片 。
一方面 , 智能驾驶不仅是车载智能芯片的事情 , 未来的智能驾驶一定会涉及车路协同 , 通过路测的边缘端智能芯片实现实时收集、低延时传输道路与车辆、车辆之间的交互信息 , 将汽车本身获取不到的盲区、路侧、他车、超远距离、全路网实时信息告知汽车端 , 帮助单个汽车或者智能车队规划路线;边缘端传感器采集的许多数据还会回传至云端 , 利用云端智能芯片处理边缘端芯片难以处理的复杂训练、推理任务 。
IDC半导体研究总监Michael J. Palma曾说:“在边缘系统中 , 神经网络做出的即时决策可以创造独特的价值 , 不受延迟和连接问题的约束——而这些问题对云解决方案来说是个挑战 。 ”未来遍布路网的边缘端智能芯片 , 将成为智能驾驶完整系统不可或缺的组成部分 。 整个智能驾驶的实现 , 更需要“云边端车”四位一体的深度联动 。
另一方面 , 寒武纪本身在云边端的AI处理器上已经有着有代表性的量产产品 。 2016年成立初期就以IP授权的形式打入高端智能手机终端市场 , 在终端智能处理器IP授权业务上一战成名之后 , 又迅速拓展云端业务 , 通过新业务提高了公司的核心竞争力和抗风险能力 , 成功规避了单一客户带来的波动影响 。 2019年底 , 寒武纪又发布了边缘AI系列芯片及加速卡产品 , 通过统一的软件开发平台 , 实现云边端无缝协同 。