文章图片
文章图片
文章图片
文章图片
文章图片
随着行业不断发展 , 大数据AI也逐渐呈现云原生化的趋势 。 复杂的业务场景及其背后涉及到的不同技术方向的开源和自研 , 使得产品运维面临技术复杂度高、规模大、场景多等挑战 。
阿里巴巴云原生大数据运维平台 SREWorks , 沉淀了团队近10年经过内部业务锤炼的 SRE 工程实践 , 今天正式对外开源 , 秉承“数据化、智能化”运维思想 , 帮助运维行业更多的从业者采用“数智”思想做好高效运维 。
一 SREWorks 是什么? 谷歌在2003年提出了一种岗位叫做 SRE (Site Reliability Engineer , 站点可靠性工程师) , 它是软件工程师和系统管理员的结合 , 重视运维人员的开发能力 , 要求运维日常琐事在50%以内 , 另外50%精力开发自动化工具减少人力需求 。
SREWorks 作为阿里云大数据SRE团队对SRE理念的工程实践 , 专注于以应用为中心的一站式“云原生”、“数智化”运维 SaaS 管理套件 , 提供企业应用资源管理及运维开发两大核心能力 , 帮助企业实现云原生应用资源的交付运维 。
阿里云大数据 SRE 团队天然靠近大数据和AI , 对大数据AI技术非常熟悉 , 且具有随取随用的大数据AI算力资源 , 一直努力践行“数据化”、“智能化”的运维理念 , 行业里的 DataOps(数据化运维)最早由该团队提出 。 SREWorks 中有一套端到端的 DataOps 闭环工程化实践 , 包括标准的运维数仓、数据运维平台、运营中心等 。
随着云原生时代大趋势的到来 , 阿里云大数据 SRE 团队将SREWorks运维平台开源 , 希望为运维工程师们提供开箱即用的运维平台 。
二 SREWorks 有什么优势? 回归到运维领域的需求 , 无论上层产品和业务形态怎么变化 , 运维本质上解决的还是“质量、成本、效率、安全”相关需求 。 SREWorks 用一个运维 SaaS 应用界面来支撑上述需求 , 同时以“数智”思想为内核驱动 SaaS 能力 , 具体包括交付、监测、管理、控制、运营、服务六部分 。
1 体系化运维平台分层架构
从“质量、成本、效率、安全”四个维度出发看运维本质相关工作 , 运维除了要搭平台、建规范、做标准 , 还要用自动理念提升效率 , 用数据驱动测试/开发/运维 , 用智能手段提前发现/预测风险问题等 。 这些可以看成是方法论 。 如何能从理论快速获得一套体系化、工程化、产品化的能力实践 , 去支撑满足上述四个维度的需求 , 就是 SREWorks 所考虑的问题 。
阿里云大数据 SRE 团队利用分层思想构筑了 SREWorks 平台产品体系 , 借鉴经典 SPI(SaaS/PaaS/IaaS)三层划分思路 , SREWorks 由“运维 SaaS 应用场景层、运维 PaaS 中台服务层、运维 IaaS 接入层”三部分构成 。
SREWorks 中还融入了运维规范、标准化思想 , 利用产品承载自动化流程、数据驱动、智能内核的方法论 。 从代码到线上业务服务的整个过程 , 运维或多或少地参与了其中一些工作 , 因此 , 围绕应用的生命周期 , 在SaaS场景层划分了“交付、监测、管理、控制、运营、服务”六大区 。 如下图所示 , 每块内容里都有代表性的核心功能 。
- 云科技|蒋烁淼云计算创业十二年:从云厂商的影子到打造中国版Datadog
- 阿里巴巴|巨鹿小学生和阿里“音乐派”合奏春日暖歌《茉莉花》
- 腾讯云|周鸿祎:一旦战事爆发关键基础设施可能成为黑客组织攻击的“活靶子”!
- 阿里巴巴|阿里调转船头布局自营,京东唯品会加速前进,电商逻辑变了
- 网易云音乐|网易云音乐发布上市后首份成绩单,净收70亿的网易云该咋看?
- 欧科云链:迎接Web3.0 为安全可信的价值互联网打好技术底座
- 京东云“一码到底”溯源技术,加速汽车后市场“触网”
- 阿里巴巴|没有看错马云,在甲骨文断供后,方才看懂阿里十年前的坚持!
- 是什么让马云预言|新零售是什么模式?解析什么是新零售
- 电力仿真软件上云提速360倍,数字电网建设又进一步