大数据|大数据开发与管理架构完整剖析( 二 )
要做什么:
- 分层管理:对于不同阶段产生的数据需要分别进行管理,以便每一步处理留痕方便后续历史追溯。主要分为5部分:ODS(Operation Data Store 数据源头层)、DWD(Data Warehouse Details 数据细节层)、DWS(Data Warehouse Service 数据服务层)、ADS(ApplicationData Service 应用数据服务)、DIM(Dimension 维表层)。
- 存储成本管理:由于数据产生量巨大,同时还伴随需保留中间处理结果,所以存储成本需要进行相应控制,控制方式有4种:数据治理、数据压缩、数据生命周期管理、模型优化。
要做什么:
- 应用支撑:对于需要数据支撑的系统与模块提供服务。首先,需要对各维度进行模型构建,例如:商品、用户、会员等。建立描述完整的宽表;其次,需要梳理数据域、业务流程、各项原子指标与派生指标,定义各项指标口径,选择合适的模型构建方法(例如:雪花模型、星型模型)进行关联构建,构建好的专题库(也可称之为业务块)向上提供服务。
- 开放接口:组织数据资产中的部分字段为接口,定义请求与相应参数并将其开放至数据市场中,用户可根据需求进行订阅申请。
要做什么:
- 日志审计:对关键操作进行数据埋点,采集日志数据进行审计。
- 安全预警:构建预警模型,配置关键性指标报警等级与阈值,预警后相关人员会通过各类渠道收到通知。
- 数据脱敏: 在涉及安全数据或者一些商业性敏感数据的情况下,需要对某些敏感信息通过脱敏规则进行数据的变形实现隐私保护。
- 签章水印:对图片、视频等文件进行可见/不可见水印加密并根据业务需求进行签章明确权责。
【 大数据|大数据开发与管理架构完整剖析】题图来自Unsplash,基于CC0协议
- 大家平常有没有觉得自己用手机的主摄拍出出彩的照片特别难?我可以说并不是你的问题|努比亚z40pro手机摄像头的焦段不适合你
- Python|小米开启春季大促,从6299降到3849元,12GB+512GB
- 英特尔|开年“机”荒?OPPO Reno这款超大杯很值,处理器是骁龙870
- |中国三大运营商局面打破!中国广电强势加入通讯市场,号段已公布
- |发布不到两个月下跌780元,12GB+256GB,2K屏新旗舰售价大跳水
- 智能手机|2021年欧洲增长最快的智能手机品牌:中国realme暴增548%成最大黑马
- 美女|美女将照片做成NFT大卖 两天超过了二千单交易
- 汇天网络|汇天网络与华为数字能源联合打造全球规模最大零碳数据中心
- |如何通过数据找到创业的“上帝视角”?
- 大家都知道|苹果日本率先推出36期免息分期服务