saas|如何正确理解商业智能BI的实时性?( 二 )


第二 , 数据加载到商业智能BI数据仓库中了 , 数据要被加工处理 , 比如去重、合并、循环计算等等算出各种指标放到数据仓库不同的层里面 , 这个数据处理的过程在商业智能BI里是最耗时间的 , 几十分钟到几个小时 。 指标越多 , 业务逻辑越复杂 , 计算处理花的时间越长 。这个就是ETL处理的核心 , Transformation 转换 。
第三 , Transformation 转换处理后的数据要写入到目标表比如商业智能BI中维度表、事实表里面 , 即Loading 加载 。


数据仓库 - 派可数据商业智能BI可视化分析平台

ETL是商业智能BI数据仓库的数据处理关键 , 其中E是数据源头 , T是中间数据计算处理的过程 , L是将计算结果写入、加载到目标表 。
大家看看 , 把这三个阶段的时间加起来 , 这个时间周期是不是很长 , 是没有办法实现商业智能BI的实时分析的 。
并且很多时候白天业务系统有人可能会用的比较晚 , 有些数据业务部门更新的时间也比较晚 。 所以大部分情况下 , 商业智能BI都会选择在晚上12点以后执行ETL的调度从业务数据源将12点以前的所有已更新的数据同步过来处理 。
所以 , 通常商业智能BI在晚上先把前两个阶段的事情给处理了 , 所有的数据都抽取、加工、计算完了 , 都提前存放在数据仓库里 。 第二天页面在刷新的时候直接访问的是已经计算好的数据仓库的数据 , 这样就很快了 。


数据可视化 - 派可数据商业智能BI可视化分析平台

如果大家碰到再有人问到商业智能BI数据的实时性的时候 , 就可以把这个过程讲的对方听一听 , 正常情况下大家应该还是可以听明白这个过程的 。
【saas|如何正确理解商业智能BI的实时性?】那有没有什么方式能够实现指标在商业智能BI可视化页面上的实时分析、实时展现呢 , 或者准实时也可以啊 , 欢迎关注更新 , 下篇文章我们再来介绍 。