巴菲特致股东的信|互金风控的三十条经验( 二 )


14)样本选择是最能体现模型开发定位和目标的,也是最吃功夫的部分。不同模型的开发,其他的有迹可循,唯有样本的选择是各有各的不同。
15)模型开发时我们总是在关心模型效果,但当模型开发完后,最重要的是稳定性。没有策略会盯着模型分的变动反复调整阈值的。有问题的信息千万不要用。
0416)策略和模型之上,要做好监控。使用没有监控的模型,就像使用没有指针的钟表,它可能在工作,但你怎么知道呢?另外,监控一切容易,响应一切困难。
17)数据分析的三板斧,看趋势、看对比、看细分。解读监控报表亦如是。光有一个数据是无意义的,比较才能使其有洞见。怎么比?和过去比,和其他的比,分开了自己比。
18)线上如果出现问题,很难直接指向模型,因为复杂性其解释权都在模型同学手上。策略同学不要听他们的解释。问题容易出在模型上面,但不是说“锅”都是模型同学的。如果模型和策略是分开的,还是配置个模型验证团队吧。
19)风控中,做一个新模型,或者一条新策略,都是要充分评估更优的。迭代的模型要跟很多东西对比,首要对比的就是想要替换的模型。策略的优化第一个要比的也是原策略。真正意义的ABTest在风控里不存在。
20)工作中,风控的节奏不如营销增长那边那么快,因为风险是后置的,无法去快速又高频地测试。
0521)芝麻信用这类产品,与消金信贷机构的A卡B卡是有很多不同的,关键在于前者要和用户交互。这意味着,构建这样的模型时要根据经验挑选覆盖各个维度的变量,并使其保持绝对的可解释性,而不光是选择区分度高的变量。因为,信用衡量的是先享后付的能力,那就是要让该享受服务的人能享受到服务。一个该一个能。该的人不能,不该的人能,是要解决的关键问题。
22)不要过于关注风险。什么都不做才没有风险。
23)有征信数据和借款人的借贷历史数据,它就是判断一个借款人还款能力和还款意愿的强数据。这些强数据就是反映一个人未来还款与否的最重要的指标,其他的大数据只能是一个补充。
24)因果关系很难,但相关关系很容易。我们从来不能很好地解释,这群人逾期的原因是什么。我们擅长计算,这群人具备这些特性,他们的逾期水平比较高。
25)模型是对简化目标的学习,简化目标就要符合你的业务目标,这跟产品的第一层是用户体验本质上是一样的。真正的模型迭代有两种,一种是在简化目标下不断提升效果,另一种是让目标简化地更精准。
0626)在信贷业务中,用到的黑名单也容易越积越多,这容易导致其失效,尤其在场景非常丰富的大厂。我们可以对其中低风险的人群清退,就像失信被执行人履约完毕后也会被退出一样。但归根结底,黑名单清退的价值没那么大。另外,黑名单清退的逻辑在于六个字的思想:不要轻视敌人。
27)对于一般公司而言,联合建模太麻烦了,往往不如直接接入标准产品。标准产品省去了联合建模的麻烦,同时还避免了建模中样本过少以及后续客群迁移导致过早失效的问题。
28)小贷公司的风控问题是,缺少自有数据,必须依靠三方数据源。结果,绝大多数小贷公司都会陷入一个困境,就是引入一个新的数据源,测试效果好好的,一上线对通过率、坏账率一点提升都没有,甚至常常出现负面影响。这是因为建模不能简单地圈定一个样本,一个数据源一个数据源往里面加去计算增益。要与时俱进,用上最新的样本,迭代整个策略,如有必要下线有问题的数据源。