华为公布下一代数据中心理念,推出电力模块3.0硬件产品( 二 )


华为公布下一代数据中心理念,推出电力模块3.0硬件产品
文章图片
模块化的数据中心机房避免了传统攒建式机房分散采购、分散安装等带来的挑战 , 使PUE更可控 。
第二是下一代的数据中心的供电模块是极简的 。 在传统的数据中心中 , 供电模块要占到15%到20%的面积 , 而华为通过将整个供电模块的部件融合、链路重塑 , 做到供电极简 。
第三是下一代数据中心的温控是极简的 。 在冷源侧 , 下一代数据中心可最大化利用自然冷源 , 避免传统数据中心需要四次热交换才能完成将机房内部热量带到机房外的情况 , 一次完成热量交换 。 在热源侧 , 下一代数据中心贴近热源进行智能化升级 , 高密场景下液冷技术和风冷技术混合部署 。
3、自动驾驶:运维、能效、运营均自动
华为公布下一代数据中心理念,推出电力模块3.0硬件产品】华为下一代数据中心的第三个特征是“自动驾驶” , 即可以运维自动、能效自优、运营自治 。
运维自动是指下一代数据中心使用AI进行远程巡检 , 实现运维数字化和标准化 。
数据中心的很多设备是哑设备 , 巡检人员需要有一定的专业性才能完成巡检维护工作 。 通过AI技术 , 一个人巡检一个2000机柜的数据中心原来需要花2小时 , 未来有望缩短为5分钟 。 数据中心运维数据化和标准化则包括将数据中心可视化和将数据中心专家的历史维护经验云化共享 。
能效自优同样用到了AI技术 。 下一大数据中心通过华为应用云和AI技术 , 通过700多个采集点实时监测制冷系统运行状态 , 采用DNN深度神经网络 , 训练出PUE模型 , 下发推理平台 , 基于当前气候条件和IT负载率等情况 , 推理出PUE最优的调节方式 。 每当室外环境温度变化超过2摄氏度或IT负载率变化超过5%后 , 推理平台启动下一轮寻优 , 5分钟就可以找到最优的控制策略 。 采用AI技术 , 数据中心的年均PUE优化效果可以达到5%到15% 。
华为公布下一代数据中心理念,推出电力模块3.0硬件产品
文章图片
运营自治是指数据中心建设完成后 , 投运运营时 , 通过AI技术实现资源优化和能源按需调度 。
4、安全可靠:主动安全和架构安全
杨友桂说 , 华为认为下一代数据中心的第四个特征是安全可靠 。 下一代数据中心的安全可靠主要包括主动安全和架构安全两方面 。 安全可靠是数据中心最大的诉求 。
主动安全方面 , 下一代数据中心要实现AI预测性维护和系统自动化故障响应两点 。 传统的数据中心都是发现事故 , 再进行处置 。 通过AI技术 , 数据中心管理人员可以对数据中心进行AI预测性维护 , 避免事故发生 。 或者当事故发生后 , 下一代数据中心无需等待人工响应 , 可以自动响应 , 实现1分钟发现 , 3分钟完成分析 , 5分钟实现业务恢复 。
架构安全方面 , 下一代数据中心从器件到整体全方位的做到安全可靠 。 部件级层面 , 下一代数据中心可以实现5分钟完成业务恢复;设备层面 , 多冗余设计 , 单点故障时可以快速切换到备用设备 , 实现0毫秒切换;系统级层面 , 全链路可视乎加上AI技术的加持 , 可以达到99.999%的可用性 。
华为公布下一代数据中心理念,推出电力模块3.0硬件产品
文章图片
二、华为下一代数据中心第一个重磅产品:电力模块3.0
在数据中心中 , 供电系统是最重要的子系统 , 随着IT部分的高密化和集约化 , 数据中心供电系统的占地面积逼近IT系统的占地面积 , 电能损耗高达5.5% 。 同时供电系统现场交付时交付过程错综复杂 , 设备有多达15家以上的供应商负责 , 还要现场压制上千条的线缆 。 在后续运维过程中 , 供电系统出现问题主要依靠告警驱动式的被动响应 , 运维效率低 。