英特尔|未来十年架构创新的“灯塔”,英特尔揭开XPU的第二篇章( 二 )

英特尔|未来十年架构创新的“灯塔”,英特尔揭开XPU的第二篇章
文章插图
按照英特尔的介绍,能效核是一个高度可扩展的x86微架构,它能满足客户从低功耗移动应用到多核微服务的全方位计算需求。对比英特尔迄今为止最多产的CPU微架构——Skylake,能效核可在相同功耗下提升40%的单线程性能,或者在提供相同性能时,功耗仅为Skylake的40%不到。可想而知,如此出色的能效提升如果体现在计算集群当中,带来的价值将会是何等惊人。而性能核,不仅是英特尔迄今为止性能最高的CPU内核,而且在CPU架构方面也实现了阶梯式提升,可推动未来十年的计算发展。它是一个更宽、更深、更智能的架构,可提高执行并行性,降低时延,提升通用性能。值得一提的是,针对数据中心和机器学习场景,性能核还提供了更多专用硬件或者说加速器,例如新的英特尔高级矩阵扩展(AMX)来执行矩阵乘法运算,以获得显著的性能提升,如将AI INT8处理性能提升至现在的约8倍。英特尔|未来十年架构创新的“灯塔”,英特尔揭开XPU的第二篇章
文章插图
将能效核与性能核联接起来的,是英特尔硬件线程调度器,它能与操作系统无缝配合,在合适的时机把合适的线程分配给合适的内核。这有点像我们熟知的“混合动力”汽车,通过油和电的混合驱动,让同样的一箱油,跑出最长的距离。这套运行逻辑也让我想到了“平衡术”理论。处理器的性能和功耗原本在天平的两端,性能的提升总是会带来更高的功耗,这是一件过去十几年都极难平衡的事,而英特尔的混合架构,用硬件线程调度器作为一个支点,将更高性能和更高能效置于不同的“核”,做到了更优的性能平衡。IPU:释放CPU的内核面对全球汹涌而来的数字化浪潮,大量新兴的云应用驱动了数据中心的快速发展,英特尔必须要从数据中心架构为起始点,为数字化和智能化转型提供“算力之源”。过去CPU是英特尔的战略核心,所有的设计都是让越来越多的处理通过CPU来解决,如今英特尔则变得更为灵活,有选择地将一些功能从CPU当中分离出去,用更“对路”的芯片来承接和处理,这其实能够更灵活地为客户提供更为敏捷的价值,这也是英特尔强调XPU战略的原因。比如IPU的发布。英特尔|未来十年架构创新的“灯塔”,英特尔揭开XPU的第二篇章
文章插图
我们知道,服务提供商和企业正大量投资于超大规模数据中心,以便为云原生应用和微服务提供高效的计算。提供这些服务的应用程序必须能够访问高速、低延迟的存储和更快和更安全的网络基础设施。但是,虚拟交换、安全和存储等基础设施相关的应用和服务可能会占用大量CPU资源。从架构创新的角度,企业需求要一个专门的处理器,来加速这些基础设施服务,并通过把它们从CPU上卸载下来,来释放CPU的算力,用在更适于它的应用场景和负载中。这正是英特尔推出基础设施处理器 (IPU)的初衷。简单地说,IPU是一种可编程的网络设备,旨在使云和通信服务提供商减少在CPU中的额外性能开销,从而充分释放其性能价值。英特尔数据平台事业部首席技术官Guido Appenzeller表示,基于IPU的架构存在几个优势:第一,基础设施功能和客户工作负载的强分离使客户能够完全控制CPU;第二,云运营商可将基础设施类的任务卸载到IPU上,更大化提升CPU利用率和收益;第三,IPU可管理存储流量,减少时延,同时通过无磁盘服务器架构有效利用存储容量。借助IPU,客户可以通过一个安全、可编程、稳定的解决方案更好地利用资源,使其能够更好地实现计算与存储的平衡。我们相信,IPU将是未来数据中心架构的核心组件。目前的IPU有两类架构:第一个是基于ASIC的IPU;第二个是基于FPGA的IPU。它们各有优势:基于FPGA的IPU能够让企业快速实施新协议,应对不断变化的要求或新协议;而专用的ASIC IPU则有望实现性能和效率的最大化。