腾讯QQ浏览器2021AI算法大赛,北大冠军团队经验分享,附详细代码

机器之心专栏
机器之心编辑部
一文梳理腾讯QQ浏览器2021AI算法大赛冠军方案 。
历时两个多月的腾讯QQ浏览器2021AI算法大赛[9]已经告一段落 , 大赛自2021年8月15日启动以来 , 受到了全球AI算法爱好者及业界的广泛关注 。 整个赛程历时68天 , 覆盖全球279个城市 , 共吸引来自276个不同高校、企业和社会的算法精英1853人 , 组成852支队伍参赛 , 其中进入决赛的TOP20队伍就涵盖了北京大学、清华大学、复旦大学、香港科技大学、中科院大学、华南理工大学、浙江大学、西安交大、中山大学、西安电子科技大学等顶尖院校 , 也有来自德国、加拿大等国际高校的学生 , 期间共完成了近7000次提交 。
腾讯QQ浏览器2021AI算法大赛,北大冠军团队经验分享,附详细代码
文章图片
腾讯QQ浏览器为优秀参赛团队提供价值共计41.7万人民币的总奖池 , 除此之外每个赛道前15名队伍将会额外收获校招直通复试卡 , 前8名队伍可获得QQ浏览器实习生直通终面卡 。
首届AI算法大赛议题设置“多模态视频相似度”和“自动超参数优化”两大赛道 , 以下为“自动超参数优化”赛道冠军团队 , 来自北京大学的队伍PKU-DAIR的方案分享 。 (PKU-DAIR队成员:姜淮钧、沈彧、黎洋)
团队介绍
PKU-DAIR团队的三位成员来自北京大学崔斌教授DAIR实验室的AutoML自动化机器学习项目组 。 团队研究方向包括超参数优化(HPO)、神经网络结构搜索(NAS)、自动化机器学习系统(AutoMLSystem)等 。 团队不仅在国际顶级会议上发表了多篇论文 , 为提高AutoML技术的易用性与可用性 , 团队还相继在Github开源了黑盒优化系统OpenBox[1][7]、自动化机器学习系统MindWare[2][8]等 。
在本次自动化超参数优化赛道中 , 团队基于实验室自研开源黑盒优化系统OpenBox进行调参 。 初赛时使用OpenBox系统中的并行贝叶斯优化(Bayesianoptimization)算法 , 决赛在初赛基础上加入早停机制 。 比赛代码已在Github上开源[3] 。 下面将进行详细介绍 。
Rank1st比赛代码开源地址:https://github.com/PKU-DAIR/2021_AIAC_Task2_1st黑盒优化系统OpenBox地址:https://github.com/PKU-DAIR/open-box腾讯QQ浏览器2021AI算法大赛,北大冠军团队经验分享,附详细代码
文章图片
初赛算法介绍
赛题理解
在信息流推荐业务场景中普遍存在模型或策略效果依赖于“超参数”的问题 , 而“超参数''的设定往往依赖人工经验调参 , 不仅效率低下维护成本高 , 而且难以实现更优效果 。 因此 , 本次赛题以超参数优化为主题 , 从真实业务场景问题出发 , 并基于脱敏后的数据集来评测各个参赛队伍的超参数优化算法 。
参赛者需要提交超参数生成的算法代码 , 算法每一轮需要提供一组超参数 , 裁判程序会返回超参数对应的reward 。 参赛者的算法要求在限定的迭代轮次和时间内 , 找到reward尽可能大的一组超参数 , 最终按照找到的最大reward来计算排名 。
针对该赛题 , 优化器需要在每轮以同步并行方式推荐5个超参数配置 , 共执行20轮推荐 , 即总共搜索100个超参数配置 。 对每个超参数配置均执行完整资源的验证 , 并且在比赛的问题抽象中 , 不同超参数的验证时间相同 。
根据现有研究 , 贝叶斯优化是超参数优化(黑盒优化)问题上SOTA的方法 , 而且比赛场景中的超参数空间维度不超过6维 , 并非超高维问题 , 较适合贝叶斯优化方法 , 因此我们选定贝叶斯优化作为初赛的搜索算法 。 另外 , 问题中所有的超参数均为连续型(离散浮点型)超参数 , 这决定了我们的超参数空间定义方法、贝叶斯优化代理模型以及优化器的选择 , 接下来也将分别进行介绍 。