s3|与数据同行 智能湖仓如何让“数据驱动业务”更上一层楼?( 二 )
其三是完全托管。这也是贯穿于亚马逊云科技在云计算方面的始终不变的重要原则,在顾凡看来,他们更希望用户将有限的精力集中在业务代码而非仓的管理、湖的管理、湖的构建、仓的构建和数据移动上,这是云厂商应该做的事情。
在这样的设计思路之下,智能湖仓架构就有了相对清晰的定义:拥有专门构建的数据分析服务,而且能做到数据、湖、仓和专门构建的数据服务的无缝数据移动,统一管理、低成本,它不仅实现了湖和仓的打通,更是由湖仓专门构建数据服务连接形成的一个整体。
通过将亚马逊云科技的数据服务无缝集成,打通数据湖和数据仓库之间数据移动和访问,智能湖仓可以实现数据在数据湖、数据仓库,以及在数据查询、数据分析、机器学习等各类专门构建的服务之间按需移动,为用户带来连续且统一的整体,最大程度提高其数据价值。从而满足各种实际业务场景下的不同需求和业务创新。
围绕智能湖仓,亚马逊云科技也提供了各种数据分析服务,包括Amazon DMS、Amazon Snowball、Amazon Kinesi这样的底层数据移动及实时流动的数据服务;在Amazon S3上针对分析专门优化过的存储层;针对不同的分析场景而生的Amazon Redshift、Amazon EMR、Amazon Athena、Amazon Kinesis data Analytics、Amazon Elasticsearch这样的分析引擎;以及QuickSight这样的商业智能BI。多维度且全面的服务类型为用户带来了极高的可用性。
在顾凡看来,一个好的数据架构应该是为了未来十年而打造的,灵活开放和成本可控的,而且要具备可以打破数据孤岛、提供专门构建的服务和极致性能、实现数据的融合治理、具备敏捷分析和智能化应用的特征,具体反映在智能湖仓上,则是以下五个特点:
灵活扩展、安全可靠
作为数据湖的基础组件,AmazonS3的可用性、可扩展性,以及大容量的、根据用户使用习惯自动分层的数据存储能力,是确保整个智能湖仓架构有效应用的前提,同时也意味着数据湖的成本在扩展性可用性很高的情况下,依然能保持最佳的安全性、合规性、审计能力及成本可控性。
专门构建、极致性能
与亚马逊云科技一贯以来打造产品的思路相同,智能湖仓同样遵循专门构建这一原则。“并不存在一个技术在功能上、性能上、扩展性上都能实现最佳,我们强调专门构建,为用户提供适合的工具”顾凡表示。具体来看,智能湖仓拥有AmazonAthena这样的查询工具,也有针对大量日志数据实现监控应用的AmazonElasticsearch Service,也有为流数据处理而生的AmazonKinesis……围绕AmazonS3数据湖,亚马逊云科技为用户提供了多样的数据分析的服务集合,使得用户可以更加有针对性为不同的需求挑选不同应用,实现业务的突破。
数据融合、统一治理
数据在数据湖、数据仓库以及围绕着数据湖周边构建的所有的这些专用的数据存储,SQL数据库,Non-SQL数据库,甚至更多不同的分析引擎中实现无缝移动对智能湖仓而言是一个难点。总的来看,数据移动的方式分为由外向内的数据入湖,以及由内向外的数据出湖和数据的环湖移动三种,“这三个数据的移动路径,如果做一个比喻的话就是一支篮球队,在进攻的时候,无非是球从内线传到外线或者是从球从外线传到内线,或者是从外线导几下突然投一个三分”,顾凡举了个生动的例子。
在智能湖仓架构中,提供了像Amazon Glue、Amazon Redshift数据湖导出、Amazon Redshift联邦查询这样的功能实现ETL提取转换加载,还是可视化数据准备,再结合Amazon Redshift Spectrum,使得一个复杂查询就可以实现跨湖、仓、数据库实现数据查询,同时也能通过Amazon Lake Formation简化数据的安全管理。
- 副董事长|京东方A董秘回复:公司与全球数千家供应商保持着良好的合作关系
- text|《2021大数据产业年度创新技术突破》榜重磅发布丨金猿奖
- 微信|个人收款码与商业收款码有什么不一样
- 酷睿处理器|关键数据出炉,京东比阿里差远了
- iqoo|iQOO Z5x兼备长续航与优质好屏,无压力畅玩游戏
- 任正非|任正非与孟晚舟的姓氏为什么不一样?
- 蓝思科技|苹果与34家中国供应商断绝合作,央视呼吁:尽快摆脱对苹果依赖
- 小米 11 Ultra 内测 NFC“读写勿扰”与“解锁后使用”功能
- 李现与eStar队员合影并晒签名队服 称“感谢冠军战队的礼物”
- 文和友|泡泡玛特与飞书达成合作 新消费代表企业加速迁移飞书