算法模型|数据分析 VS 算法模型,如何高效分工合作?( 二 )

【 算法模型|数据分析 VS 算法模型,如何高效分工合作?】以上情况统统不清楚。
因此无论是算法/分析,谁接需求,都得先问清上边的问题。当然,在问题定义都模糊不清的时候,让数据分析师站出来沟通更合适。数据分析师和业务贴的更近,更容易理解业务语言,引导业务思路。
业务方进一步给出的回答是:

  1. 要帮助管理岗位招到更合适的人
  2. 要发现:XX省市的流水线工人更容易招,我们集中招聘
  3. 要让整个部门的用人成本,控制在XXX万元以内
那么,是不是可开始建“多维度”“立体式”的模型了呢?
不!远远不到!
四、典型合作场景之二:任务分解有三大问题,制约着项目推进:
第一,管理岗位的“合适”定义不清晰。
管理人员的考核,远比流水线工人复杂。流水线工人只要考察年龄、身份证、学历几个简单维度即可,考操作技巧也能通过标准化作业考核。管理人员则复杂的多,还有“领导看他顺不顺眼”这种高度个性化、无法量化的考核点。因此不能简单的止步在这里。需要进一步定义。
第二,各省市劳动力数据缺失。
注意:从现在HR收到的简历里筛选出合适的,和从茫茫人海里锁定哪里的劳动力多,完全是两个问题。因为已经收到的可以统计数据,茫茫人海压根连数据都没有。如果盲目开工,很有可能引发误判。
第三,整体部门用人成本与招聘效率,根本就是两个问题。
整个部门用人成本,除了新招聘以外,还有在职工资福利,还有离职人员赔偿等等。如果目标是控部门整体成本,那到底哪一块总量最高,哪一块占比最大,哪一块是冗余,哪一块增长最快,要提前一一分析清楚。再看怎么解决。
此时,可以拆出至少五个任务:
任务1:定义管理岗位的“合适”(可能为了定义合适,要单独建个业务模型,比如胜任力模型)。
任务2:基于过往面试数据,为管理岗位“合适”做标注,为建模做准备。
任务3:收集各地区劳动力市场数据(劳动力市场发布信息、中介提供信息等)。
任务4:结合过往招聘活动,验证分地区招聘合理性(也有可能求职者虽然是内地省份的人,但是找工作还是跑到沿海省份找,分地区意义没那么大,这些假设都待验证)。
任务5:分析整体用人成本结构与走势,找到成本控制关键点。
这五个任务,主要都是数据分析的活。数据分析理清现状,采集数据,后边算法就能有的放矢。比如:
在已有管理岗位“合适/不合适”标注的情况下,结合简历信息、猎头给到信息、招聘渠道信息,对面试人员建分类预测的模型(逻辑回归/决策树),预测“合适”概率。
在已经有整体用人成本结构、增长原因、发展趋势数据情况下,建预测模型(时间序列/多元回归)判断用人成本是否会超出预期,从而干预决策(不要因为短期缺人就大量招聘,对比给加班费和增加新人成本差异)。
当然,还有第三个合作点:在工作中遭遇挑战,大家一起应对。
五、典型合作场景之三:问题解答面对“模型为什么不准!”终极问题,一定是所有人一起努力。首先要排除的,是外部因素、意外波动、业务主动行为的影响。不要是个问题就往模型身上泼脏水。
比如:突然有高管变动,引发管理层招聘要求全变招工来源地发生疫情,人员出不来行业领头企业突然提高了薪资,拉高了整个行业成本原定的招聘计划因为各种原因推迟原定招聘计划,没有达成预期,要加新渠道/新方式所有这些因素都会让原先设计的模型不成立或者效果下降。