指环王|GPT-3自己上网搜答案!OpenAI新成果,让AI回答开放式问题

指环王|GPT-3自己上网搜答案!OpenAI新成果,让AI回答开放式问题
文章插图
智东西(公众号:zhidxcom)
编译 | 程茜
编辑 | 李水青
智东西12月17日消息,本周四,OpenAI基于AI模型GPT-3发布了WebGPT,该模型可在线搜索问题组织答案,并添加引用来源,更准确地回答开放式问题。
在回答问题时,WebGPT可以通过浏览器进行搜索,在不同链接中寻找相关答案,并在最后组织答案时,将引用来源标注上去,使得答案来源的准确性有迹可循。
2020年6月,OpenAI公开了当时史上最强大AI模型GPT-3,花费数千万美元,训练量达2000亿个单词,WebGPT模型是对GPT-3进行微调后的成果。
OpenAI称:“我们很高兴开发更通用、智能的AI模型,但挑战依然存在,例如应对不熟悉的开放式问题时,AI模型的回答还不是很准确。”
一、长江跟尼罗河谁更长?AI帮你上网搜答案像GPT-3这样的语言模型可以充分应对不同的任务,但对于那些在现实世界中都没有准确答案的任务,这个模型往往会产生一些充满“迷惑”的信息。
为了解决这个问题,研究人员教AI模型使用网络浏览器对问题进行“百度”。该模型中包含“搜索……”、“在页面中查找:……”或“引用:……”之类的命令,遇到开放式问题,WebGPT可以模仿人类搜索的行为来自动检索答案。
通过这种方式,WebGPT模型就学会了从网页中收集段落,然后使用这些段落来撰写答案。
【 指环王|GPT-3自己上网搜答案!OpenAI新成果,让AI回答开放式问题】当被问道:“尼罗河和长江谁更长?”
WebGPT:“尼罗河比长江长。尼罗河在维多利亚湖和地中海之间绵延6650公里(4130英里)。长江从青海唐古拉山脉的源头到东海,全长6300公里(3915英里)。”
指环王|GPT-3自己上网搜答案!OpenAI新成果,让AI回答开放式问题
文章插图
WebGPT通过检索回答“尼罗河和长江谁更长?”的问题
当被问道:“为什么苏伊士运河在2021年3月被封锁?”
WebGPT:“苏伊士运河于2021年3月被封锁,因为一艘名为‘永远’的集装箱船搁浅在那里。这艘船曾载着20000箱的货物,在有两条水道的运河河道被强风吹进了运河中,因此其他船只无法绕过曾经给定的航道。苏伊士运河管理局雇佣了一艘拖船将这条曾经被遗弃的运河拖出运河。运河阻塞对欧洲、亚洲和中东之间的贸易产生了重大的负面影响。这引发了集装箱现货运价的新一轮飙升,该运价最终开始从创纪录的高点回落。”
指环王|GPT-3自己上网搜答案!OpenAI新成果,让AI回答开放式问题
文章插图
当被问道:《哈利波特》系列和《指环王》哪一部有更多的单词?
WebGPT:“《指环王》三部曲比《哈利波特》系列包含更多的单词。包括《霍比特人》,整个《指环王》系列包含576459个单词。相比之下,《哈利波特》系列包含1084170个单词。”
指环王|GPT-3自己上网搜答案!OpenAI新成果,让AI回答开放式问题
文章插图
研究小组对GPT-3的微调与最开始对GPT-3的训练方法一样。他们首先训练模型模仿人们回答问题的方式,这使它能够使用基于浏览器检索到的内容来回答问题。
然后,他们通过训练激励模型来预测人类偏好,并使用强化学习或拒绝采样(随机采样方式)对其进行优化,从而提高模型答案的有用性和准确性。
二、超一半回答优于人类,但可能引用不可信来源ELI5是一个用来对机器学习模型调试的Python库,研究人员挑选了这个库中“像我五岁一样解释(Explain Like I’m Five)”栏目里的开放式问题,发现经过系统训练的WebGPT已经可以回答其中的问题了。