数据库|数据缺少怎么办?四个小方法与你分享
编辑导读:做数据类的项目有一个逃不开的问题:没有数据怎么办?巧妇难为无米之炊,没有数据,可以造、可以找、可以搜集。本文作者分享了四个小技巧,希望对你有帮助,一起来看看吧。
文章插图
做数据类的项目,解决业务问题,以及深入研究某项数据应用的过程中,我们通常遇到的最大的问题就是没有数据,没有数据,没有数据。
特别是在数据应用方面,不仅是一个没有数据成了我们的难点,数据量少也是难点之一。这个问题一直在困扰着我,甚至因为这个问题,我还经常被领导吐槽什么也做不出来,我有苦说不出,左右为难,想起来这段日子真的是苦不堪言,巧妇难为无米之炊啊!
于是我想了很多折中的方案,下面是我解决这些问题的小方法,分享给你。
一、造数据,先有再优如果说我们有时候会遇到某个业务刚刚搭建,还未来得及搜集较多的数据,或者是只有极少的数据,更有甚者一点数据都没有,这个方法也可以先用起来,那就是先根据业务逻辑造仿真数据实施。
第一步,拿到业务数据库的表结构。表结构是一张数据表的基础,可以理解为在一张Excel表格里表格的标题。表结构提供了业务内容的字段、数据类型、数据格式,根据表结构造出来的数据才更加符合业务逻辑。如果业务有多张表,那么还需要拿到表的关联关系,也就是ER图。
退一万步讲,如果我们连表结构都拿不到的话,那就尽力拿到建表的SQL脚本,然后根据SQL脚本自造表结构,这样做就是造出来的数据精准度又会降低一个档次。无论如何先行动起来,才知道会遇到什么问题。
第二步,开始造数据。现在市面上存在很多造数据的工具,产品经理协调好技术小伙伴造数据需要的东西之后,就可以交给他们开始造数据了。有时候造出来的数据会存在偏差比较大,然后再手动调整造的数据即可。
利用这个方法先做出符合业务需要的数据,拿着这些数据试试能否解决问题,如果说相差比较大,那就继续优化造出来的数据,直至根据经验和试验对比预估误差值减少。先有再优!
二、求助内部团队,帮忙干点小活如果说我们造的仿真数据难以令领导信服,那么就动手造一些相当真实的业务数据吧。
拿我做过的一个案例举例。
【 数据库|数据缺少怎么办?四个小方法与你分享】我们想要做景区客流量监测的应用,我去找了很多景区客流量的图片,然后一个个打点人头像,给算法团队做数据集。但是仅靠我一个人,要是做出足够算法团队使用的数据量,那估计要累到吐血了。
熟悉内幕的小伙伴可能都知道,类似这样的工作是有专门的数据供应公司把这部分工作外包出去,或者是经常发布一些兼职找人干,成熟的数据标注人员一天可以看超过10 000张图片,所以如果有50个人参与到标注中,两天就可以标注超过百万的图片。
But,尴尬的是我们也没有钱去找那么多外包小伙伴来干。于是我就发动了我们团队的UI、技术、算法工程师一起完成这个工作,虽然大家不像成熟的标注员那样一天一万张图片,但是标注出来的数据集也暂时足够使用了。当然,作为产品经理也不能让人家白干活,我也拿出了产品经理的利器:请大家喝奶茶!!!
三、利用”搜商“,借力外部数据”搜商“这个词,不知道大家都听说没有。我第一次听到这个词的时候,顿时觉得除了情商、智商,搜商对一个产品经理来说也很重要。现在是信息爆炸的时代,想要什么信息都能找到。
我们能搞到数据的方法还有很多,随便百度搜一下会发现有各种各样类型的数据共享网站。
- text|《2021大数据产业年度创新技术突破》榜重磅发布丨金猿奖
- 酷睿处理器|关键数据出炉,京东比阿里差远了
- 财智干货|数智化发展任重道远,财务中台提升数据服务价值 | 大数据
- 央媒表态后,联想关键数据出炉,柳传志这回要扳回一局?
- 数据库|OPPO悄悄上新机,骁龙8核+5000mAh电池,256G仅售1599元
- 数据仓库|红米真我moto三款骁龙870手机对比:2000元以内,谁更值得买?
- 中文|爱数智慧CEO张晴晴:基于”情感“的人机交互,要从底层数据开始
- B费全场数据:2次射正打入2球,3次抢断、1次拦截
- iPhone|东芝NAS硬盘N300系列+ORICO硬盘柜=“数据保险柜”
- 数据库|丁磊致歉“鱼眼观察”作者并回应:已撤回删稿函