QQ浏览器在面对上述挑战中 , 选择运用预训练+finetune+AutoML的新范式和多目标多场景联合优化的新深度模型等创新来应对信息流这方面的技术挑战 。 在腾讯QQ 浏览器举办的AI算法大赛中也可以窥视到多模态技术与超参数对这些浏览器难题的优化 , 这两个技术也是此次比赛的两条赛道 。
比如在视频流的场景中 , 多模态的技术可以根据视频观看的时间及关注的兴趣及行为让下一个视频更符合、相似目前观看的视频 , 在语义上的相似可以让用户的体验更好 。 QQ 浏览器在多模态技术中也做了评价视频语义相似度的问题 , 可以更精确地评价两个视频的文本区别 , 为用户不再推荐重复的内容 , 增强在推荐方面的泛化和兴趣探索的能力 , 很好地缓解信息茧房的问题 。
而超参数技术可以实现多目标融合 , 也就是在推荐系统中 , 从刷视频的点击率演进到点击、关注、点赞等同时完成 , 超参数搜索把以前人工寻参的方式通过网格搜索、非个性化寻参到个性化寻参的方式提升效率 。 在腾讯QQ浏览器实践过程中可以减少 80% 以上的寻参时间 , 大大提升了推荐系统的研发效率 。
我们知道浏览器在实际的推荐和搜索业务场景中 , 有异常丰富且持续演化的内容需求 , 这些庞大的内容数据并没有客观清晰的定义 , 数据标注也就成为内容算法研发的核心瓶颈 , 而预训练大模型是解决这一问题的“良药” 。
聚焦推荐与搜索:当浏览器拥抱大模型
预训练大模型也是近两年AI产业中最火的关键词之一 。 目前比较有名的模型参数量都已经达到万亿级别了 , 应用场景差异也比较明显 。 以 OpenAI斥巨资打造的GPT-3为例 , 它依然是偏 NLP 的模型 。 在AI大模型的探索上 , 无论是着眼于提升超大规模AI算力 , 还是突破学术前沿的角度 , 本质上都是通过将海量的数据进行预训练、预集成 , 形成高鲁棒性、低样本量需求的大模型 。 企业可以根据自身的应用场景 , 在大模型的基础上进行少量的调参即可完成落地 。
而浏览器与大模型的结合 , 可以将浏览器背后场景的大量内容理解、内容生成中的AI研发所需样本量大大降低 , 解决标注量与成本这个在浏览器整体业务场景中的核心瓶颈 。
QQ浏览器实验室自研了预训练模型“神舟” , 这个模型具有百亿参数的训练能力 , 可以为搜索、推荐、内容理解等多种业务场景起到直接帮助 , 提升各种自然语言理解算法效果 。 神舟预训练大模型专注中文自然语言理解 , 基于预训练的研发模式 , 可以提前把语言语义中通用的知识学习到预训练模型中 , 针对下游具体的任务只需要学习任务相关的知识 。
通过该模型QQ 浏览器可以微调和满足业务中出现的如评论理解、搜索 Query 推荐等NLP 需求 , 可以减少 40% 以上所需的标注数据量和相应的研发时间 , 节省了标注的成本 , 大大提升了研发的效率 。 在学术上 , 也刷新了业界纪录 , 登顶了中文语言理解测评基准 CLUE 榜单上 , 成为首个在中文自然语言理解综合评测数据上超过人类水平的预训练模型 。
当前神舟大模型已经逐步应用于 QQ 浏览器的搜索、看点资讯、小说等多个场景 。 随着大模型进一步的迭代和实践 , 也会深度改造 QQ 浏览器的搜索推荐能力 , 更好地理解并满足用户表达背后的意图与需求 。
大算力时代 , 机器变得更加理解信息与人 , 比如在医疗领域的问诊问答、交互对话等实际场景中 , 大模型可以为语义的理解带来更强的综合效果 , 而浏览器拥抱大模型 , 可以更好地沉淀大量的知识 , 帮助我们更准确地探索AI与机器学习的边界 。
- 副董事长|京东方A董秘回复:公司与全球数千家供应商保持着良好的合作关系
- 苹果|库克压力确实大,在众多国产厂家对标下,iPhone13迎来“真香价”!
- 微信|个人收款码与商业收款码有什么不一样
- 设计师|UI设计岗位薪资怎么样
- iqoo|iQOO Z5x兼备长续航与优质好屏,无压力畅玩游戏
- 任正非|任正非与孟晚舟的姓氏为什么不一样?
- 蓝思科技|苹果与34家中国供应商断绝合作,央视呼吁:尽快摆脱对苹果依赖
- 小米 11 Ultra 内测 NFC“读写勿扰”与“解锁后使用”功能
- ios|华为迎来新里程碑,在新领域旗开得胜!
- 打脸!华为在美国,用专利把英特尔、苹果、微软、高通打败了