京东云稳定性达行业最高标准:单云主机SLA提升至99.99%( 二 )


硬件故障影响域,是数据中心内由网络交换机或电源设备故障造成的单点硬件故障最大影响范围,通常可以理解为一个或一组机架 。不同影响域内的服务器,由于存在电力网络的物理级别隔离,因此可以最小化物理硬件潜在故障、网络中断或电源中断的影响 。用户可配合使用“高可用组”产品实现反亲和性调度,将云主机实例创建在多个故障影响域内,最大程度规避局部硬件故障对业务的影响 。
管理软件故障影响域,是指由云服务系统管理软件故障造成的云资源生命周期管理异常影响范围 。随着云上用户体量和资源规模逐步扩大,京东云在单地域下以分组集群模式管理系统软件及服务,将多个可用区内的计算资源及系统服务横向划分为多个逻辑分组,多分组集群模式下系统服务的部署均以分组为最小单位,每个分组可以实现独立升级,以此精确控制软件故障机系统升级对用户的影响范围,降低服务异常对用户业务的影响,实现无感知的平滑升级 。
大规模复杂场景磨练,护航企业数字化转型
单云主机的稳定性承诺提升到 99.99%,折射出京东云的前沿技术优势和丰富业务经验积 。历经京东零售、京东物流、京东科技等京东集团内部核心业务的千锤百炼,并通过历年京东618及京东11.11考验,京东云在保障服务稳定性方面有长期的技术积累和实践 。
伴随京东体系的持续高速发展,京东云始终面临数据流量的大规模增长,从前端网站、订单、结算、支付、搜索、推荐,到后端的仓储、配送、客服、售后全流程,为满足各类业务系统在云上的平稳运行,磨练出京东云在云服务稳定性方面的的极强能力 。
以今年618为例,京东云每秒用户访问峰值同比提升152%,访问带宽同比提升185%,混合云操作系统云舰在线管理Pod数量超过200万,运行容器峰值核数超过1000万,背后是京东云以超高弹性应对海量并发需求,以稳定、安全、可信赖的技术服务,高质量护航全程用户体验 。
不仅仅在京东体系内部,京东云也在供应链、物流、金融、保险、地产、健康等十余个行业深耕多年,本次单云主机稳定性承诺升级,更是对广大客户的郑重承诺,将助力更多政企客户搭建高可用的云服务,让企业上云不再是难题,让云上业务运作不再有障碍 。