搜狐首页 财经 大理寺的猫

手机搜狐

SOHU.COM

DeepMind新电脑具有三维想象力

谷歌(Google)在伦敦的人工智能子公司DeepMind开发了一款自我训练的视觉计算机。据DeepMind的首席执行官介绍,这款计算机“仅利用几张2D快照就能生成一个完整的3D场景模型”。

杰米斯?哈萨比斯(Demis Hassabis)表示,这套被称为“生成式查询网络”(GQN)的系统可以从任何角度想象和呈现场景。

GQN是一个通用系统,具有广泛的应用潜力,从机器人视觉到虚拟现实模拟。详情发表在周四出版的《科学》(Science)刊物上。

“值得一提的是,(DeepMind的科学家)开发了只依赖自身图像传感器所输入信息,就可以自主学习的系统,且无需人类监督,”马里兰大学(University of Maryland)的计算机科学家马蒂亚斯?茨威格(Matthias Zwicker)说,他没有参与这项研究。

这是DeepMind一系列备受瞩目项目中最新的一个,这些项目展示了一种之前未曾预料到的人工智能系统自学能力——在编程人员为其设定基本参数之后。

去年10月,DeepMind的AlphaGo自学了围棋这种超级复杂的棋类游戏,然后轻松击败了人类棋手。上月,DeepMind的另一个人工智能系统学会了在迷宫中寻找路径,其方式类似于人类大脑的导航功能。

GQN项目旨在复制一个人类大脑仅仅通过环顾四周就能了解世界的那种轻松方式。

“之前无法知道神经网络能否学会以如此精确和可控的方式来创建图像,”DeepMind研究员阿里?埃斯拉米(Ali Eslami)说。“然而,我们发现具有足够深度的网络可以在没有任何人类工程干预的情况下学习透视和光线。这是一个非常惊人的发现。”

GQN由两部分组成。第一部分是通过图像传感器来观察场景,然后用计算机代码将其表达出来。第二部分是“生成式网络”,它可以从先前未观察到的视角来预测或想象场景。

未来的GQN系统有望比今天的计算机视觉技术的功能更为强大,所需的处理能力也会更低。目前的计算机视觉技术是用由人类生成的大量带标注的图像数据集来训练的。

但GQN仍有局限性——GQN迄今只在包含少量物件的相对简单场景中展示了想象力。

“尽管我们需要更多的数据和更快的硬件才能在现实世界中部署这种新型系统,但这让我们在了解如何建造拥有自学能力的机器方面向前迈进了一步。”埃斯拉米说。

精选