欢迎光临
我们一直在努力

研究人员帮助机器人思考并抽象地计划

布朗大学和麻省理工学院的研究人员开发了一种方法,通过构建周围世界的抽象表示来帮助机器人计划多步骤任务。他们的研究发表在人工智能研究杂志上,是朝着建立能够像人一样思考和行动的机器人迈出的一步。

对于机器人来说,规划是一件非常困难的事情,主要是因为他们如何看待并与世界互动。机器人对世界的感知只包括其相机收集的大量像素,其行动能力仅限于设置控制其关节和夹具的各个电机的位置。它缺乏对这些像素如何与我们在世界上可能认为有意义的概念相关的天生的理解。

布朗的计算机科学助理教授,新研究的主要作者乔治·科尼达里斯说:“与世界的低级接口使人们很难决定做什么。” “想象一下,如果你不得不考虑你想要到达的每一块肌肉,那么计划像去杂货店一样简单的东西会有多难,并提前想象一下TB的视觉数据。一路走过你的视网膜。你会立刻陷入细节之中。人们当然不会那样计划。我们能够引入抽象的概念,抛弃那么大量无关的细节和只关注重要的事情。“

即使是最先进的机器人也无法实现这种抽象。当我们看到机器人计划和执行多步骤任务的演示时,“几乎总是如此,程序员已经明确告诉机器人如何思考这个世界以便制定计划,”Konidaris说。“但如果我们想要能够更自主地行动的机器人,他们将需要自己学习抽象的能力。”

在计算机科学术语中,这些类型的抽象分为两类:“程序抽象”和“感知抽象”。程序抽象是由低级别动作组成的程序,由较高级别的技能组成。一个例子是捆绑打开车门所需的所有小动作 - 所有涉及到旋钮,转动它并拉开车门的电机动作 - 进入一个“打开门”技能。一旦建立了这样的技能,您就不必担心它是如何工作的。您需要知道的是何时运行它。他说,机器人专家 - 包括Konidaris本人 - 一直在研究如何让机器人多年来学习程序抽象。

但根据Konidaris的说法,在感知抽象方面的进展较少,这与帮助机器人理解其像素化环境有关。这是这项新研究的重点。

“我们的工作表明,一旦机器人拥有高水平的运动技能,它就能自动构建一个兼容的高级符号表示世界 - 一个可以证明适合使用这些技能进行规划的人,”Konidaris说。

学习世界的抽象状态

在这项研究中,研究人员将一个名为Anathema Device(或Ana,简称Ana)的机器人引入一个包含橱柜,冷却器,控制橱柜内灯光的开关以及可以留在冷却器中的瓶子的房间。或橱柜。他们为安娜提供了一套高级运动技能,用于操纵房间内的物体 - 打开和关闭冷却器和橱柜,翻转开关并拿起一个瓶子。然后他们让Ana松了一口气,在房间里尝试她的运动技能,在每次执行技能之前和之后记录她的相机和执行器的感官数据。这些数据被输入到团队开发的机器学习算法中。

研究人员表明,Ana能够学习一种非常抽象的环境描述,其中只包含了她能够执行特定技能所必需的内容。例如,她了解到为了打开冷却器,她需要站在前面而不要拿任何东西(因为她需要双手打开盖子)。她还学会了与关闭冷却器盖子相关的视野中像素的正确配置,这是唯一可以打开它的配置。

她学到了与其他技能相关的类似抽象。例如,她了解到橱柜内的灯光是如此明亮,以至于它使传感器变亮。因此,为了操纵橱柜内的瓶子,灯必须关闭。她还了解到,为了关灯,需要关闭橱柜门,因为打开的门阻挡了她对开关的接触。由此产生的抽象表示将所有知识从高清图像提取到文本文件,只有126行。

“这些都是关于她周围环境的重要抽象概念,”Konidaris说。“门在打开之前需要关闭。除非打开,否则你不能将瓶子从柜子里取出来等等。而且她只要通过执行她的技能并看到会发生什么就能学会它们。”

规划在抽象

一旦Ana手持她学到的抽象表现,研究人员就要求她做一些需要做一些计划的事情:从冷却器中取出瓶子并将其放入橱柜中。

正如他们希望的那样,安娜航行到冷却器并打开它以露出瓶子。但她没有接受它。相反,她提前计划好了。她意识到,如果她把瓶子放在她的抓手里,那么她将无法打开橱柜,因为这样做需要双手。因此,在打开冷却器后,她导航到了橱柜。在那里,她看到灯开关处于“开”位置,她意识到打开橱柜会阻挡开关,所以她在打开橱柜之前关闭开关,返回冷却器并取回瓶子,最后放置它在橱柜里。简而言之,她提前计划,发现问题并在问题发生之前加以解决。

“我们没有向Ana提供她计划完成任务所需的任何抽象陈述,”Konidaris说。“她自己学习了这些抽象,一旦有了这些抽象,计划很容易。她发现这个计划只用了大约4毫秒。”

Konidaris表示,该研究为将人工智能应用于机器人技术提供了重要的理论基础。他说:“我们相信让我们的机器人能够抽象而不是具体地进行规划和学习,这将是构建真正智能机器人的基础。” “如果以正确的方式思考问题,很多问题通常都很简单。”

Konidaris的合着者是来自麻省理工学院的Leslie Pack Kaelbling和Tomas Lozano-Perez。该研究得到了国防高级研究计划局和麻省理工学院情报计划的奖励。

免责声明:本网站图片,文字之类版权申明,因为网站可以由注册用户自行上传图片或文字,本网站无法鉴别所上传图片或文字的知识版权,如果侵犯,请及时通知我们,本网站将在第一时间及时删除。