设为首页 收藏本站 English

当前位置: 芝麻娱乐网 >> 刘蓝溪

响应自然语言命令的机器人计划器杜近芳

发布时间:2022-09-29 19:39:01

响应自然语言命令的机器人计划器

在未来的几年中,无论是在家中还是在其他环境中,机器人都可以通过各种方式为人类用户提供帮助。为了更加直观,机器人应该能够遵循自然语言的命令和指令,因为这使用户可以像与其他人一样与他们进行通信。

考虑到这一点,麻省理工学院脑,思维与机器中心的研究人员最近开发了一种基于采样的机器人计划器,可以训练该计划器以理解自然语言命令的序列他们开发的系统发表在arXiv上的一篇论文中,该系统将深度神经网络与基于采样的计划程序结合在一起。

进行这项研究的研究人员之一安德烈·巴布告诉TechXplore:“出于安全原因,并且因为语言是询问您想要的东西的最便捷的界面,确保我们家里的未来机器人能够理解我们是非常重要的。” “我们的工作结合了三方面的研究:机器人计划,深度网络以及我们自己的关于机器如何理解语言的工作。总体目标是仅机器人提供一些句子含义的示例,并使其遵循新的命令,从未听过的新句子。”

Barbu和他的同事进行的这项研究的深远目标是更好地理解肢体语言交流。实际上,虽然现在已经很好地理解了语音交流背后的功能和机制,但大多数在动物和人类之间进行的交流都是非语言的。

更好地理解肢体语言可能会导致开发更有效的机器人与人之间交流的策略。因此,麻省理工学院的研究人员一直在探索将句子翻译成机器人动作的可能性,反之亦然。他们最近的研究是朝这个方向迈出的第一步。

图片来源:Kuo,Katz和Barbu。

进行这项研究的另一位研究员郭延龄对TechXplore表示:“机器人计划者在探索机器人可以做什么然后让机器人执行动作方面非常了不起。” “我们的作品需要一个句子,将其分解成小块,这些小块被翻译成小的网络,然后重新组合在一起。”

就像语言是由可以按照语法规则组合成句子的单词构成的一样,由Barbu,Kuo和他们的同事Boris Katz开发的网络由经过训练以理解单个概念的较小网络组成。当组合在一起时,这些网络可以发现并代表整个句子的含义。

研究人员开发的新型机器人计划器具有两个关键组成部分。第一个是递归的分层深度神经网络,它控制计划者如何探索周围的环境,同时还预测何时计划的路径很可能实现给定的目标,并分别估计机器人可能进行的每个动作的有效性。第二个是经常在机器人技术研究中使用的基于采样的计划程序,称为快速探索随机树。

Barbu解释说:“我们计划人员的主要优势在于,它几乎不需要培训数据。” “如果你想教一个机器人,你不会在家中给它成千上万个例子,但是很少是很合理的。训练机器人应该采取与训练狗一样的动作。”

尽管过去的研究还探索了通过口头命令引导机器人的方法,但其中介绍的技术通常仅适用于离散环境,在这种环境中,机器人只能执行有限的动作。另一方面,研究人员开发的计划程序可以支持与周围环境的各种交互,即使它们涉及到机器人从未遇到过的物体。

Kuo解释说:“当我们的网络混乱时,计划者负责接管工作,弄清楚该怎么做,然后网络下次可以接手该做什么时就可以接管。” “我们的模型是由零件组成的,这也赋予了它另一个可取的特性:可解释性。”

当他们无法完成给定的任务时,许多现有的机器学习模型将无法提供有关出了什么问题以及遇到的问题的信息。这使得开发人员更难识别模型的缺点并有针对性地更改其架构。另一方面,由Barbu,Kuo和Katz创建的机器人计划器的深度学习组件逐步展示了其推理能力,阐明了所处理的每个单词传达的关于世界的信息以及它如何将分析结果结合在一起。这使研究人员能够找出导致其过去无法成功完成给定操作的问题,并对架构进行更改以确保其在将来的尝试中能够成功。

Barbu说:“我们对机器人可以在很少的人类帮助下快速学习语言并快速学习新单词的观点感到非常兴奋。” “通常,深度学习被认为是非常耗费数据的;这项工作强化了这样一种观念,即当您建立正确的原则并让代理执行有意义的操作时,他们几乎不需要那么多数据。”

研究人员通过一系列实验评估了规划器的性能,同时还将其性能与现有RRT模型的性能进行了比较。在这些测试中,计划人员成功地获取了单词的含义,并使用所学的知识来表示以前从未遇到过的句子序列,其表现优于与之相比的所有模型。

将来,由这组研究人员开发的模型可以为能够更有效处理和遵循自然语言命令的机器人的开发提供信息。目前,他们的计划器允许机器人处理和执行简单的指令,例如“捡起桌子上的盘子”,但仍无法捕捉到更复杂的指令的含义,例如“当玩具落在盘子上时捡起娃娃”地板并清洁它。因此,Barbu,Kuo和Katz目前正在尝试扩大机器人可以理解的句子范围。

郭说:“我们的长期未来目标是探索逆向计划的思想。” “这意味着,如果我们可以将语言变成机器人动作,那么我们也可以观察动作并询问机器人'当他们这样做时,人们在想什么?” 我们希望这将成为解锁机器人肢体语言的关键。”

贵阳白癜风哪家专业

中山哪家治男性不育好

深圳妇科医院哪家好?深圳仁爱医院

唐山治疗白癜风专科医院哪家好

重庆看骨科最好的医院

友情链接