G论智三易,串联通讯,贯通边缘,演进认知,汇于机器:听五位IEEE Fellow畅谈 gai( 三 )


在梅涛博士的演讲中,他分别介绍了视觉认知技术上的最新技术及应用情况、算法从感知智能到认知智能的必要,以及视觉领域的未来发展方向。
在过去的50年中,计算机视觉领域经历了巨大的变革。从最初的特征工程到目前的深度学习,其性能和精度都在同步的提升。最新的计算机视觉技术可以分为标签识别、目标跟踪、视频流行为识别、语义分割、文字生成图像、3D视觉感知等领域。
在细粒度的视觉识别研究中,基于各种模型结构技术(例如自注意力机制)已经可以实现精细物体、标签的识别。而在3D图像处理领域,很多技术能够辅助将日趋成熟的2D技术迁移至3D领域。在图像的文字描述方法中,很多商品图片的描述、根据文字自动生成模拟换装效果的技术也已经大规模使用。
随后,梅博士结合实际的产品为我们介绍了视觉AI的各种有趣应用,包括基于图片的商品搜索、搭配推荐、智能导播、智能客服等。这些技术已经深入到我们生活的方方面面。
梅博士介绍道,从感知智能过度到认知智能是一种宏观统筹的期望,希望算法达到从视觉迁移到知觉、触觉、听觉等方面的能力。在未来,这是AI发展的大方向。
在这个过程中,鲁棒性、数据偏见等方面的挑战十分严峻。从目标的角度上来说,传统人工智能能够增强人们的认知并且提供辅助。而感知智能则是希望能够理解人类的行为,并且拟人进行推理等功能。在能力方面,以前的人工智能方法希望能够找到模式,而感知智能是想将人类的意识和理解进行建模,并且找到解决事情的思路和逻辑。
在这个前进的过程中,需要解决三个核心问题:对结构知识进行建模,模型的可解释性,以及推理能力的集成。
最后,梅博士介绍了视觉领域的未来发展方向。他认为计算机视觉目前已经行进到技术谷的第四阶段尾声,意味着它可以在未来的两三年间被工业界大量应用,从而影响我们的生活。

熊辉:AI思想在人性和社会性中的体现

G论智三易,串联通讯,贯通边缘,演进认知,汇于机器:听五位IEEE Fellow畅谈 gai
文章插图
熊辉教授
第三位演讲者是熊辉教授,他的演讲题目是《人工智能算法中的人性和社会性》。
熊辉教授现为香港科学技术大学(广州)讲席教授,人工智能学域主任;曾在学术休假期间担任百度研究院副院长并主管5个实验室。
熊辉教授一直致力于数据挖掘、大数据分析等领域的科学研究。在熊教授的演讲中,他深入浅出的将人工智能经典算法进行更高层级的审视和回顾。他用清晰的思路和生动的比喻为我们介绍了人工智能和人类社会的关系。如果想真正做好算法,一定要知道领域知识和专业知识的结合,明白什么是不易。领域知识能够告诉我们不易在哪、是什么。然后做到艺术和哲学的有机平衡,才能做好算法的应用。
熊教授首先介绍了GAN算法与人性以至于社会性的关联。在GAN的世界中,有目标驱动的辨别式学习方法,就像为了考试而背题。还有以学习问题根源为目标的生成式学习方法,即学习问题背后的本质。
而站在个人的层面,我们也需要一个很好的辨别器。不同的人有不同的经历和选择。他们有的成功,有的失败,主要的区分在于自己所使用或经历的辨别器。好的匡正你的未来,来让你的人生走在正确的方向上,让你的资源用在正确的方向上。人生就是一场漫长的算法,二者一一对应。算法之所以有用,很大的原因就是它从生活中来,抽象了我们的经验和哲理。
站在一个系统的宏观角度来观察所有的人工智能算法,可以将其用易经的理论进行梳理。它们可以分成三个主要类别,不易、简易和变易。