云原生|字节跳动是如何建设云的?

云原生|字节跳动是如何建设云的?
文章插图
来源 : 字节跳动
作者 : 火山引擎
「创业最前线」经授权发布
12月2日,火山引擎的全系云产品正式亮相。
依托于字节跳动云原生理念和实践,火山引擎推出了78项云产品服务,涵盖云基础、视频及内容分发、数据中台、开发中台、人工智能等5大类。
过去9年,字节跳动持续建设IT基础能力。如今,我们已经实现每天新增1500个AB实验和2万次线上变更,3周完成设计和上线新App,27天备战春晚红包项目。
在这些敏捷迭代和创新背后,“云”都发挥了关键作用。那么,过去9年里,字节跳动是如何建设云的?字节跳动副总裁、火山引擎业务负责人杨震原和大家聊了聊我们的云实践。以下为演讲全文:
早上好,欢迎大家来到火山引擎云产品发布会。特别感谢大家一直以来对火山引擎的支持。
今天火山引擎云产品发布会的主题是“新云,共未来”,不管是新朋友还是老朋友,大家都知道我们要发布云产品。火山引擎是字节跳动技术能力的输出。火山引擎的云产品,也是基于字节跳动的理念和实践来建设的。今天我要跟大家分享的,就是字节跳动在发展的历程中是怎么建设云的。
1、IT基础建设的目标:敏捷要讲这个话题就要回到很多年前。当时我们公司还很小,主要有一个核心产品今日头条。按照公司一直以来的做事风格,我们在讨论IT基础建设时,首先就在讨论,我们的目标是什么。直到现在我还记得很清楚,我们定下来的核心目标就是敏捷,就是要快。
云原生|字节跳动是如何建设云的?
文章插图
当时,今日头条是一个全新的移动互联网产品,我们有着去建设全球最大内容分发平台的愿景。我们每天都会有很多想法、很多讨论,包括内容体裁、创作工具、产品交互、推荐算法等等,每天都在变。如果这些想法能更快实验、更快发布,就会给公司带来很强的竞争力。如果有想法但不能快速上线,就会给公司发展造成很大的风险。
我们实现了敏捷的目标,产品增长很快,大家觉得建设敏捷的IT基础效果很好。这个理念一直延续到现在。
但是,只关注敏捷是不行的,因为还有很多问题。我们需要考虑到稳定性、综合成本,不能说做得非常快,但成本很高;还要考虑到运维的复杂度等等。实现敏捷目标的同时,不能让稳定性等问题成为短板。
在介绍我们怎么做云之前,首先分享一些案例。外界有些人说字节跳动好像是一家App工厂,虽然并不准确,但我们做产品确实是非常快的。有些新的产品从开始有想法,我们决定要做,只用三周时间就能发布上线,这个基础就是围绕着敏捷目标建设的云。
再分享一个案例。去年距离除夕只有27天的时候,我们的产品技术团队收到了参加央视春晚红包互动的通知。这个活动很复杂,有很多环节。大家也知道,春晚是一个突发用户量非常大的事情,只有27天的时间,要做方案的设计、资源的准备、产品开发上线,最后我们顺利完成了这个工作。而在以前,这类活动一般都会有3个月的准备时间,而且都是互联网大厂在有很多资源准备的情况下完成的。
云原生|字节跳动是如何建设云的?
文章插图
再列一些数据。第一个是数据中心的天级部署。这是什么概念?当我们交付了一个新的数据中心,我们的物理服务器上架联网之后,部署业务以及切流,只要一两天就可以完成。这也是因为我们自建数据中心,以及在全球范围内用了很多云的供应商,不断迁移,锻炼出了这一套能力。