酷派|人人都在讲数据治理而不问业务,这很危险( 二 )


这是一次新的轮回 。
我们当年靠一次项目打造的大数据平台 , 汇聚的那些数据资产 , 在过去几年发挥出了相当的价值 , 但它们已经完成了第一阶段的使命 , 数字化转型要求我们的数据治理再次起航 , 这是业务驱动的结果 , 也是生产关系适配新时期生产力的要求 。
第二 , 我们需要支撑的模式 , 变了显然 , 我们不可能把数字化业务都自己干了 , 企业的数据团队必须致力于去打造一个数据开放的生态 , 让所有具备数据能力的内外伙伴都能基于开放的数据创造价值 , 让数据要素全面流动起来才能发挥出数据的最大价值 , 我们对一线的支持模式 , 更多应是园丁和教练的角色 , 而不要越俎代庖 。
从对内支撑的角度看 , 经过几年的运营 , 现在公司会点SQL的人员都超过X000人 , 如果能把数据充分开放给他们 , 其创造的价值将不可估量 。 拿建模来说 , 一线做的模型永远是比坐在办公室的建模师更接地气 , 他们最需要的 , 其实是开放的数据 。
从对外变现的角度看 , 如果所有的合作伙伴都能基于我们开放的数据自由的、安全地进行建模和应用创新 , 那创造的价值也肯定几何倍数于现在的变现规模 , 从这个角度讲 , 虽然推进数据的开放本身不算业务 , 但它对我们数据团队来讲就是最大的业务 。
我们最近几年一直在努力打造数据中台 , 希望通过数据中台去更好地开放数据 , 但真的要开放数据可并不是那么容易 , 至少有三个方面的问题迫切需要得到解决 。
首先 , 数据开放的周期偏长 。
以前我们开放数据的流程还是比较长的 , 需求人先要通过线下的方式从源端了解到数据表的相关信息 , 然后在线提交开放需求 , 审批完后由运维团队实施数据交换操作 , 一般的开放周期需要3-4天 , 有时会超过1周 。
近年来我们打造了大数据服务中心 , 将大数据平台的已有资产挂到了对外开放的服务目录里 , 内部用户可以采取订阅的方式方便的获得数据 , 当前对于低敏感级的数据开放周期 , 平均降低到了1个小时 , 效率提升了很多倍 。
但我们当前开放的数据资产范围还是受限的 , 比如一旦源端数据没采集进来 , 那么开放的周期就完全不可控 , 而一旦数据涉敏 , 那开放的周期就更长了 。
我们需要思考如何将“共享为原则 , 不共享为例外”的原则真正的落地 , 需要思考如何跟各部门协同 , 共同努力将管理原则标准化、代码化 , 自动化 , 确保流程最优、最简、最智能 , 企业也需要有数据开放的服务承诺SLA 。
其次 , 数据开放的模式有限 。
我们当前数据开放的形式只包括数据表、API等形式 , 但这些开放模式还远远满足不了对外变现的需要 , 我们至今还没有打造出比较灵活的、安全的、能够规模化应用的对外PaaS服务 , 让我们的客户可以自由的使用数据 , 我们也没有彻底解决多方数据联合计算的安全问题 , 虽然我们已经有了一些进展 , 但离规模化还有很长的路要走 。
最后 , 数据开放体验还不够好 。
最近自己去浏览了浙江省的数据开放网站 , 发现这个网站的数据开放体验挺好 , 特别是看到浙江政务网还有个老人版的入口 , 很是贴心 。
我们当前构建的数据服务中心 , 还是更多的从技术角度去做设计 , 面向的开放对象更多是开发者的角色 , 这限制了其适用范围 。 我们并没有从阿里云等网站学到做这种产品的真正精髓 , 总是急着实现功能 , 把用户体验晾在一边 , 大量的线下咨询一定程度上是效率低下的代名词 , 在数据开放上 , 体验就是生产力 。