算法|算法推歌20年:从Pandora、Spotify到QQ音乐、网易云音乐( 四 )



以起步较早的Pandora为例 , “音乐基因组计划”在推荐系统领域已深耕超20年 , 得益于8000万用户的庞大基数 , 截止目前 , Pandora已处理了超1000亿条用户反馈 。 在丰富数据的“投喂”下 , 国外音乐平台的推荐系统起点更高 。 正如Toro所说:“国外音乐平台长时间搭建起的数据体系是最宝贵的财富 , 而这些东西是算法层面无法解决的” 。

同样无法短时间解决的 , 还有国内音乐创作生态的问题 。 在音乐市场尚未成熟的背景下 , 仍存在不少蹭热度、滥竽充数的创作现象 , 当这些歌曲流入推荐歌单中时 , 无疑会使用户体验大打折扣 。
当然 , 由于当下受众市场音乐审美的“参差” , 确实给了一批“以次充好”的歌曲以生存空间 , 但并不意味着用户永远只能沉迷在“神曲”之中 。 当被问及音乐平台是否应该肩负起引导用户审美的责任时 , Toro认为:“毫无疑问是需要的 , 这是每个平台都应该达到的效果” 。 算法其实也是有价值观的 , 科技向善不应该只是一句口号 , 我们也乐见于更多不同类型的好音乐被听到 。

与此同时 , 随着个性化推荐系统的飞速发展 , 不少隐形问题也开始被放上桌面 。 比如 , 推荐系统带来的“信息茧房”效应就一直饱受诟病——如果一直被推送同一种类型的内容 , 用户的兴趣可能会被限制在其中 。 有网友曾指出 , Spotify推荐音乐类型和风格范围会随时间推移而逐渐收窄 , 这意味着如果不去主动寻找其他音乐 , Spotify的推荐算法只会强化已推荐音乐的类型 。
而在今年4月 , Spotify的研发中心开发了一种新的动态模型——用户喜好过渡模型(Preference Transition Model , PTM) , 通过在音乐流媒体、饭馆推荐、电影推荐三个领域的试验 , 发现PTM能够“揭示一些用户偏好随时间变化的显著规律” , 在一定程度上可以预测用户喜好的变化趋势 。

国内的推荐系统也上线了深度时序网格来探知用户兴趣的变化 , 但真实准确地反映用户的兴趣迁移还很难 。 目前 , 推荐系统更多的是引导用户进行兴趣与品味的探索——基于一定的价值观 , 推荐系统会给偏好老歌的用户推荐一些较新的歌曲 , 给偏保守的用户推荐一些较为“先锋”的歌曲等 。

不过 , 个性化推荐带来的用户隐私问题也被重视起来 。 自今年1月Spotify获批从用户语音来推测情绪的专利以来 , 这项技术一直饱受争议 , 不少人担心自己的“私密信息”在应用软件的过程中被泄露 。 这样的担心并非无中生有 , 有心之人利用推荐系统侵犯用户隐私的事件并不少见 。

2016年 , 剑桥分析公司通过小测试的形式获取了5000万Facebook用户的个人信息 , 进行心理学分析后 , 其通过社交媒体向这些用户“个性化推荐”有利于特朗普竞选的内容 。 据统计 ,在民众没有察觉的情况下 , 这些推荐内容潜移默化地影响了全美至少四分之一的潜在选民 。

由于在面对不同的互联网产品时 , 用户有着不同的行为表现 , 因此整合不同平台推荐系统刻画出的用户画像 , 必然会使用户画像更为形象立体 。 但这同样就会带来侵犯用户隐私的问题——不同平台的合作势必要对用户身份进行关联 , 打破利用用户信息与侵犯用户隐私间微妙的平衡 。

而如果不能解决“推荐与隐私的悖论” , 用户将永远无法安心地享受技术带来的便利 。 8月27日 , 国家互联网信息办公室发布的关于《互联网信息服务算法推荐管理规定(征求意见稿)》就提到 , 算法推荐服务提供者“不得将违法和不良信息关键词记入用户兴趣点或者作为用户标签并据以推送信息内容 , 不得设置歧视性或者偏见性用户标签” , 同时 , “应当向用户提供不针对其个人特征的选项 , 或者向用户提供便捷的关闭算法推荐服务的选项” , 以保护用户的合法权益 。