ssd|中国如何赢得新一轮超算竞赛?关键在向数据密集型超算转变( 四 )


ssd|中国如何赢得新一轮超算竞赛?关键在向数据密集型超算转变
文章插图
在此基础上,还要让数据可以按照需求自由流动,让热数据、温数据、冷数据能够智能分级。
也就是将高价值的文件放置在高可用性、高性能的存储设备上,低价值的文件放置在成本较低的、性能和可用性规格较低的设备上。
ssd|中国如何赢得新一轮超算竞赛?关键在向数据密集型超算转变
文章插图
当然,还要达到合理的存算比。
一直以来我国超算中心建设都存在重算力、轻存储的问题。
在我国,存力(存储容量PB)与算力(计算算力PFLOSPS)的比例为1:2,相应的投资比例为1:3。这两个数据,美国已经达到1:1。
如果按照现在的超算中心建设模式推行,几年后我们势必会出现存储量短缺的危机。所以接下来,我们还有重视存力上的规划。
推进全光化多网融合高速互联网络构建随着处理数据越来越多、种类更为丰富,传输上的高带宽、高IOPS和低时延需要得到很好保障。
同时也要注意全周期的数据安全。
ssd|中国如何赢得新一轮超算竞赛?关键在向数据密集型超算转变
文章插图
事实上,超算中心能够快速计算、推理,也离不开设备之间的高速互连。
想要达到更好的效果,需要从元件材料和传输技术两个方面入手。
材料上,光子集成产品在尺寸、功耗、成本、可靠性方面优势明显,是未来光器件主流发展方向。
所以我们要大力推进“光进铜退”,用光子技术来构建高速互连的网络。
ssd|中国如何赢得新一轮超算竞赛?关键在向数据密集型超算转变
文章插图
技术上,要让超算中心中的多网络进行融合。
超算中心中,往往有计算网络、数据网络、存储网络、监控网络等多套网络,在构建、运维、功耗上都会有很高的成本。
因此,如何让它们之间融合、降低成本,是未来数据密集型超算中心需要思考的问题。
使用低碳高效绿色节能的工程工艺最后,我们还要考虑超算中心运行过程中的具体问题。
比如能耗。
随着芯片、系统、光器件等组成在性能上的不断提升,超算对能耗的需求在日益增大。
比如在系统层面,当前100P系统的能耗大约在20MW左右,单机柜能耗达到100KW,系统能效比大约为数十GFlops/W。
如果在节能上始终没有革命性的新技术出现,未来E级以上系统的这些指标都将变得难以承受。
对此,《白皮书》提出要降低电源使用效率、提升设备能源利用效率。
一方面是降低中心PUE。
PUE值(Power Usage Effectiveness,电源使用效率)是国际上比较通行的数据中心电力使用效率的衡量指标。
PUE值越接近于1,表示一个数据中心的绿色化程度越高。
我国国家超级计算无锡中心在建设之初的PUE值为1.3左右,如今年平均PUE值降至1.22。
两年时间减少约700万度耗电量,节约了400多万元电费。
ssd|中国如何赢得新一轮超算竞赛?关键在向数据密集型超算转变
文章插图
另一方面是要提升IT设备的能源利用效率。
比如使用SSD闪存盘。
最常用的高性能SAS机械硬盘组成的存储系统典型功耗约10.6W/TB。
而SSD闪存盘组成的存储系统典型功耗仅约5.3W/TB,可降低约50%能耗。
因此,数据密集型超算中心要求全闪存存储占比50%,来极大促进超算中心的绿色发展。
构筑易用的国产应用平台支撑环境生态如此高端的设备、先进的系统、强大的算力,你或许会觉得超算离我们遥不可及。
但事实上,超算的本质还是要解决更多难题,不仅是科研方面,还有普通生活领域的。
在过去5-6年中,高性能计算和AI在各种企业中的应用已经不再稀奇了。