燧原|加速发力云端推理场景,业内带宽最大的云端AI推理卡来了!

燧原|加速发力云端推理场景,业内带宽最大的云端AI推理卡来了!
文章插图

加速发力云端推理场景,燧原科技日前在上海发布了第二代云端人工智能推理加速卡“云燧i20”——这是时隔仅五个月,继今年7月发布云端人工智能训练加速卡“云燧T20”之后,燧原科技又推出的全新一代针对云端推理场景的AI加速产品。
业内最大AI加速卡存储带宽
从数据来看,云燧i20拥有迄今为止业内最大的AI加速卡存储带宽,高达819 GB/s,远超行业同类产品水平;同时全面支持从FP32、TF32、FP16、BF16到INT8的计算精度。对比第一代推理产品,云燧i20将浮点算力提升到1.8倍,整型算力提升到3.6倍。
燧原|加速发力云端推理场景,业内带宽最大的云端AI推理卡来了!
文章插图

【 燧原|加速发力云端推理场景,业内带宽最大的云端AI推理卡来了!】在经济效益和部署灵活性层面,基于虚拟化和多实例加速技术,云燧i20能够实现单卡多用户,同时支持6个业务互不干扰、安全隔离运行。让更多云端推理应用同时享受专有的算力加速,为客户业务架构带来轻耦合、灵活可靠的实现方式,显著提升资源利用率与投入产出比。
“云燧i20的发布标志着燧原科技在云端AI算力加速领域,从训练到推理的完整产品线已全面迭代到第二代,能够以更有竞争力的产品,为互联网、智慧城市、智慧政务,以及金融、交通、能源等传统行业客户提供更优的AI计算方案。”燧原科技CEO赵立东表示,当前,我国芯片产业正处于激烈的成长与蜕变时代,性能赶超业内旗舰GPU的云燧i20正是我们的关键成果之一。”
在实际应用上,目前以语音识别、图片识别、视频内容分析为主的感知类应用,内容推荐和欺诈交易拦截等决策类应用在云端大部分都是以实时在线的方式提供服务。不过,由于神经网络的参数越来越多,数据带宽需求也越来越高,兼顾高带宽和低延迟变得至关重要。云燧i20创新性地采用了高带宽HBM2E存储,实现了高达819GB/s的超大带宽,可为各类云端推理业务提供高吞吐、低延时的性能,保障其准确、平稳、高效的运行。
以更高性价比提供极致化性能
新一代“邃思”AI推理芯片采用第二代高性能计算核心和数据引擎,由12nm工艺打造,通过架构升级,大大提高了单位面积的晶体管效率,从而实现了与目前业内7nm GPU相匹敌的计算能力。不仅如此,基于12nm成熟工艺带来的成本优势,使得云燧i20在相同性能表现下更具性价比优势。
燧原科技COO张亚林指出:“云燧i20全面提升了算力,在兼顾全精度算力的同时大幅度提高了整型运算,大力加强了模型覆盖率和泛化支持的能力,在多项基准测试中,其模型性能、能效比均处于国内领先水平,可以满足云端推理业务高度多样化的需求。燧原科技目前已经拥有第二代的训练和推理产品,针对客户的业务场景提供原始创新的、具有高性能及性价比的‘训练+推理’完整解决方案,并支持国产服务器和操作系统,可以帮助客户进行云端系统部署,全面且持续为客户创造价值。”
引领原始创新国产AI算力落地
自第一代云端AI推理加速卡“云燧i10”发布后,燧原科技在构建原始创新的通用算力和自主生态上投入良多。以其国产AI算力产品为核心,以商业生态和科研生态为支撑,实现燧原科技的云端AI推理产品在互联网、金融、政务等多家客户的商业落地,并获得认可。
之江实验室发展合作部副部长吴丽娟表示,之江实验室今年3月与燧原科技成立联合研究中心,围绕人工智能应用场景,共同开发具有标杆性的技术解决方案,构建开源开放的创新生态系统,“目前,燧原科技的第一代人工智能训练产品‘云燧T11’正在之江实验室搭建千卡高性能计算的液冷集群,打造符合国家碳中和政策导向的低碳绿色数据中心。未来,我们还会在智能计算的更多领域合作研发。”