算法|算法推歌20年:从Pandora、Spotify到QQ音乐、网易云音乐( 三 )



QQ音乐推荐系统的另一个创新点则是建立了歌曲的知识图谱 。 在采访中 , QQ音乐数据算法负责人Toro对音乐先声表示 , 知识图谱是由歌曲丰富的知识信息组成的网络结构 , 在这个网络中 , 每首歌曲就是一个点 , 具有相同特征(例如专辑、歌手、音色等)的所有歌曲连成线 , 所有线交织在一起 , 则构成了一张蕴含着歌曲关联信息的网状知识图谱 。
知识图谱的应用 , 无疑给分析歌曲之间的相关性提供了更多的角度 。 作为可读性较高的外部知识载体 , 歌曲的知识图谱提供的信息也应用到了QQ音乐的个性化推荐板块(个性电台、每日30首等) 。

在用户分析方面 , QQ音乐主要采用行为序列和语义分析两种模型 。 用户对每首歌曲的搜索、播放、收藏、切歌等在APP中的所有行为构成的行为序列 , 再结合从语义分析出的用户音乐个性 , 帮助QQ音乐为每位用户刻画出了独有的“音乐肖像” 。
可见 , 在歌曲角度和用户角度 , QQ音乐的算法推荐系统尽可能做到多样化的数据融合和本土化 , 在新热歌曲的推荐上表现也比较突出 。
而作为国内第一个以歌单为底层架构的在线音乐平台 , 网易云音乐对推荐系统有着自己的理解 。 除了用户对一首歌曲的播放、收藏、转发等常见的反馈外 , 社交功能强大的网易云音乐还拥有评论区这一丰富的“资源” 。 为此 , 网易云音乐专门上线了针对评论语义分析功能 , 以从评论的语义中判断用户对歌曲的偏好程度 。

随着推荐系统近年来的飞速发展 , 用户的要求也在水涨船高 , 不少用户表示推荐系统很少给自己带来“惊喜感” 。 这是由于在已有的推荐系统中 , 用户画像方法大都没有考虑用户属性标签的时效性 , 因此很难刻画用户的动态变化 。

网易云音乐对于深度时序网格的引入 , 在一定程度上解决了这个问题——深度时序网格对用户过去一段时间及当前的听歌习惯进行分析 , 通过对用户兴趣点的快速更新 , 不仅实现了对用户的实时建模推荐 , 还能帮助用户发现潜在喜欢的歌单类型 。 网易云音乐相关负责人对音乐先声表示 , 这在一定程度上带来了用户使用中的”惊喜感” 。
但由于深度时序网络较为复杂 , 推荐系统的可解释性在一定程度上也会受影响 。 可解释性主要分为两个方面 , 一方面是算法的可解释性 , 算法的可解释性差意味着在推荐系统出现偏差时 , 算法工程师更难找到问题所在;另一方面则是推荐结果的可解释性 , 如果一个推荐系统能够给出推荐这些内容的原因 , 则说明其具有较好的可解释性 。

清华大学张敏教授在某购物平台上进行的一项实验表明:当推荐结果的可解释性增强时 , 用户对其的点击率也会有所提升 。 这就说明 , 良好的可解释性意味着更高的用户接受度 。 算法推歌也是同样的道理 。

也就是说 , 在给出精准推荐的同时 , 还能给出可靠的解释 , 这样的推荐系统往往能收到更好的推荐效果 。 这也是目前国内外音乐平台在个性化推荐系统领域的努力方向——不仅要提高用户选择推荐内容概率及用户满意度 , 还要提高用户对系统的信任与接受程度 。
算法之外 , 推歌路在何方?长期以来 , 国内音乐平台的推荐系统一直被拿来同国外作比较 , 不少用户表示 , 目前国外音乐平台推荐系统的使用体验较好 , 甚至认为这种差距主要来自于推荐技术上的落后 。
但其实 , 在世界一流的技术团队的努力下 , 从算法到模型 , 在技术层面 , 国内的推荐系统并不比国外差 。 Toro认为:“相比于国外 , 国内的推荐技术并不处于劣势 , 国外的创作者生态和数据结构发展得比较成熟 , 这是他们的优势所在 。 我们处于不同的发展时代 , 而时代的发展是每个音乐产业都要经历的 。 ”