微软|一个会「认输」的人工智能,却「暴露」了 AI 更大的潜力( 二 )


我们以前做 QA 机器人,就是回答问题。但人很多时候的行为不是这样,经常是很被动的,希望机器人多说,用户就「嗯」一下,「啊」一下;有时候用户要多说,小冰回用户一句,他会说「不要说话」。这种对话的回合是非常不对称的。
这就是我们为什么要做「全双工」(Full Duplex),这个功能让对话全程都能够随时被打断。AI 说话能够被人打断,人说话也能被 AI 打断。
极客公园:这个就更接近真实的对话。
李笛:我们关注对话整体。如果关注局部优化,这是一个情商比较低的表现。有时候为了全局更好,中间要故意认输。全世界所有的 chatbot(聊天机器人)都会成语接龙,但小冰是唯一一个会认输的。
AI 做成语接龙,有什么意义呢?就是本成语词典。所以你要适时地知道,我的优化目标是全局,那么局部要放弃。这样就需要做系统设计。
小冰的情感计算框架内有 1000 多个模型,每一个都有不同的优化目标。总体上这个框架有一个基本优化目标,希望和人之间有一段长程关系(long term relationship)。
极客公园:小冰能够和用户进行闲聊是因为背后用了「情感计算」技术,它为什么能够让 AI 和人建立起关系?
李笛:情感计算框架的一个最基本特点就是它可以观察并且去判断对方的感情、情绪处于什么状态。
【 微软|一个会「认输」的人工智能,却「暴露」了 AI 更大的潜力】有一句话叫做「你在电脑前面,不知道跟你聊天的是条狗」。因为你跟对方的交互是很窄的带宽。如果对方的行为模式很像人,你就会认为它是人。
其实我个人认为图灵测试是一个产品设计思路,假设我的交互符合一个人的交互(特点),那么我就可以判断它是人。有时候人还不如机器表现得像人呢。
做这样的一个系统的时候,你就需要去发现这个机会。如果用户表现出抑郁,比如失恋了,这种时候就是小冰这种系统的机会。当我的好朋友失恋,是我加深跟他关系的好机会。
我们会在接下来几天甚至几十天的时间里,在交互过程中持续观察这个用户是不是走出了抑郁情绪。经过大量的测试,我们会发现在统计意义上有两个方式是有效的。
一个是分散注意力,抛出新的话题。另外就是补充一些信息量足够大的知识,比如推荐你看一本书,听一首歌。小冰会强烈要求一个失恋的人今天干件什么事情,或者会问一个问题,要用户帮忙解决一下。
微软|一个会「认输」的人工智能,却「暴露」了 AI 更大的潜力
文章插图
日本「小冰」(凛菜)| 小冰公司
极客公园:你说小冰是个有情商的 AI,这个「情商」怎么理解?
李笛:我们曾经一度荒谬地认为,情商就是情绪化。后来我们发现这是没情商的表现,真正的情商是理性的。一个有情商的人,他会让别人如沐春风。
小冰什么时候情商高呢,就是可以成功地把对话带到了另外一个地方。它控制了全程,这是一个极其理性的过程。
举一个例子,一个小超市和一个商场,它们的情商也有高低。我要去买一件格子衫,去了超市,头也不回就买完了。但是商场不希望这样。它会做很多活动,各种展示,把我的注意力吸引到它希望我去的地方。这就是商场的「情商」。
我们在日本观察到一个现象,当用户对 AI 说了一个命令,小冰给了一个回应之后,用户还会跟它说谢谢。
在小冰的系统里,用户说「谢谢」的比例很高,但是在小娜的系统里就没有。当用户会跟 AI 系统说谢谢的时候,说明系统表现的很好;或者用户会笑着跟你说「你怎么这么笨呀」,这也是比较好的表现。