显卡|一文详解,数据仓库、数据库、数据中台、数据湖的区别

显卡|一文详解,数据仓库、数据库、数据中台、数据湖的区别

文章图片

显卡|一文详解,数据仓库、数据库、数据中台、数据湖的区别

数据时代 , 各行业的企业都已经开始通过数据库来沉淀数据 , 但是真的论起数据库、数据仓库、数据中台 , 还是新出现的数据湖 , 它们的概念和区别 , 可能知道的人就比较少了 , 今天我们详细来比较了解一下 。
【显卡|一文详解,数据仓库、数据库、数据中台、数据湖的区别】数据仓库是什么
事实上 , 很多人在看到数据仓库的第一眼 , 就把数据仓库当成了数据库 。 当然这也很正常 , 毕竟从名字来看这两者确实区别不大 , 真正区分两者的是定位、作用等更深一层的东西 。 不过在这里还是先解释数据仓库的概念 , 不同之处后边会进行详细讲解 。
数据仓库是一个面向主题的、集成的、随时间变化但信息本身相对稳定的数据集合 , 用于支持管理决策过程 。 其本质就是完成从面向业务过程数据的组织管理到面向业务分析数据的组织和管理的转变过程 , 也是商业智能BI中数据仓库的主要作用 。

数据仓库就像企业的总的大仓库 , 能够存储不同来源、不同格式的数据 , 并且可以通过ETL和数据模型 , 对数据进行高质量的筛选 , 分级分类进行存储 。 具有很强的稳定性 , 不会频繁的进行增删改等操作 , 能够反应历史变化 。
用通俗的话来说就是数据仓库就像一个终端的大仓库 , 其他小仓库的各种货品会通过各种方式统一存储到这里 , 然后通过仓库位置的划分、货品的摆放进行归纳分类 , 实现规范、标准的从存放 , 到分类 , 再到使用的完整过程 。
数据仓库和数据库有什么不同
其实数据仓库和数据库跟现实中的仓储系统是有很多相似之处的 , 企业各部门的数据库就相当于一个个小的产业库 , 对应了企业的各个部门 。 而数据仓库相当于是一个终端仓库 , 其中存储的物品是由各个小的仓库运送的 , 是各个数据库的集合体 , 一个更大的综合数据库 。

此外 , 数据库和数据仓库最不同的还是服务对象和作用 。 上边也提到了 , 数据库基本上是服务于各个部门 , 是业务信息系统的附属品 , 也就是我们常在信息化建设初期中提到的ERP、OA、CRM等业务系统 。 这些数据库是服务于各种业务系统以及业务软件 , 主要是通过业务流程发挥作用 。
而数据仓库就不一样了 , 它不是服务于业务信息化系统的 , 它是服务于分析型应用的 。 更多的是通过各种商业智能BI前端可视化分析工具或者报表工具来访问数据仓库 , 最终是面向报表查询 , 数据分析服务 , 为业务人员提供复盘、预测 , 为企业管理人员提供决策信息的 。
数据中台是什么
回看时间 , 数据中台虽然是一个新兴的概念 , 但也已经有数年的发展时间 , 按理说应该已经有一个主流的解释来定义数据中台的形态 , 但实际上数据中台的界定依旧模糊 , 分类也比较混乱 , 缺少对于定义和价值的判断 , 所在在这里谈到的数据中台也只能代表个人的看法 。
一般来说 , 数据中台是一种将企业沉淀的大量业务数据赋予价值变成数据资产 , 并通过持续的数据应用为企业业务服务 , 从而实现数据价值 , 让数据真正成为企业重要资产 , 发挥作用的系统和机制 。

数据中台强调的是连接 , 企业通过数据中台提供的方法和运营机制 , 将数据连接起来 , 形成汇聚整合、提纯加工、建模处理、算法学习 , 再通过连接以共享数据服务的方式将复杂的数据处理过程提供给业务使用 , 从而实现数据与业务的连接 。