日本动漫歌曲交流群

【Science】DeepMind关系推理ANN,在图像理解中击败人类

新智元 2018-12-05 12:36:51

  新智元编译  

来源:science

作者: Matthew Hutson

译者:熊笑


【新智元导读】人类通常相当擅长关系推理,但对 AI 来说是难点。谷歌 DeepMind 研究人员提出了用于关系推理的人工神经网络。它拥有处理图像、分析语言甚至学习游戏的专门架构,协同地在数据中找到模式,发现事物之间存在的关系。



您要买的新家附近有多少个公园?和你的晚餐最配的葡萄酒是什么?这些问题需要关系推理,这对于 AI 来说是难点。现在,谷歌 DeepMind 的研究人员已经开发了一种简单的算法来处理这种推理,而且它已经在复杂的图像理解测试中打败了人类。


人类通常相当擅长关系推理,一种使用逻辑来连接和比较位置、序列和其他实体的思维方法。但 AI 的两种主要类型——统计和符号——要开发类似的能力一直很慢。统计型 AI 或机器学习在模式识别方面很厉害,但它并不使用逻辑。而符号型的 AI 可以使用预先制定的规则来理解关系,但是在临场处理中表现并不好。


新的研究提出了一种方法来弥补这一鸿沟:用于关系推理的人工神经网络。类似于神经元在大脑中的连接方式,神经网络将微小的程序拼接在一起,协同地在数据中找到模式。它拥有处理图像、分析语言甚至学习游戏的专门架构。在这种情况下,新的“关系网络”设计用来比较各个场景中的每一对对象。DeepMind 的计算机科学家Timothy Lillicrap 表示:“我们在明确地迫使网络发现事物之间存在的关系。”


他和他的团队通过几项任务挑战了他们的关系网络。第一个是回答关于单个图像中对象之间的关系问题,比如立方体、球和圆柱体。举例来说:“蓝色的东西前面有一个物体; 它是否与灰色金属球右边微小的青色物体具有相同的形状?”对于这个任务,关系网络与另外两种类型的神经网络组合:一个用于识别图像中的对象,一个解释问题。在许多图像和问题上,其他机器学习算法在 42% 到 77% 的时间是正确的。人类取得了 92% 的好成绩。新的关系网络组合则在 96% 的时间内是正确的,超过了人类得分。研究人员上周在 arXiv 上发表了一篇论文,公布了这一结果。

 

DeepMind 团队还在基于语言的任务中试验了这一神经网络。它收到了一系列陈述,如“Sandra 拿起了足球”和“Sandra 去了办公室”,问题是:“足球在哪里?”(办公室)。它在大多数类型问题上与其它 AI 算法表现近似,但它在推理问题上表现抢眼:“Lily 是天鹅。Lily 是白色的。Greg 是天鹅。Greg 是什么颜色的?”(白色)。在这些问题上,关系网络得分为 98%,而其竞争算法得分约为 45%。最后,该算法分析了 10 个球跳动的动画,其中一些通过不可见的弹簧或杆连接。仅使用运动模式,它能够识别超过 90% 的连接。然后使用相同的训练来识别由移动点所代表的人类。


“他们做法的优势之一就是在概念上非常简单”,波士顿大学计算机科学家 Kate Saenko 谈到,她虽没有参与这项工作,但本人也曾与人合作开发了一种用于回答关于图像的复杂问题的算法。Lillicrap 谈到这种简单,最大的优势就是它包含在一个单一的等式里,可与其他网络结合,就像在对象比较任务中一样。论文中称之为“一个简单的即插即用模块”,使得系统的其他部分可专注于它们所擅长的工作。


“结果非常不错”,斯坦福大学的计算机科学家 Justin Johnson 评论道,他参与开发了对象比较任务及其中一个应用效果良好的算法。 Saenko 补充说,关系网络未来可以用于研究社交网络,分析监控画面,或引导自动驾驶车。


Johnson也谈到,为接近人类反应的灵活度,这一系统应学会应答更具挑战性的问题。要实现这一点,就不能仅做两个一组的对比,而是需要三个一组的对比,多组对比组的对比,或在一个更大范围内的某些组的对比(基于效率)。“我希望可以实现自己生成策略的模型”,他表示:“ DeepMind 正在致力于一种特定类别推理的建模,并非普遍意义上的关系推理。但是向着正确方向迈进的及其重要的一步”。


原文地址:http://www.sciencemag.org/news/2017/06/computers-are-starting-reason-humans