Popular science work
据美国麻省理工学院官网近日报道,该机构研究人员为了训练更先进的多用途机器人,开发出一种技术:使用一种称为扩散模型的生成式人工智能(AI),可将不同领域、不同形式的多个数据源整合起来,用于多种任务。
假设你想训练一个机器人,让它了解如何使用工具,然后快速学会用锤子、扳手和螺丝刀来维修你的房子。为此,你需要大量数据来演示工具的使用。
现有的机器人数据集在形式上差异很大。例如,有些包括彩色图像,而另一些则由触觉印记组成。数据也可在不同的领域收集,如模拟或人工演示。每个数据集都可能包含一个独特的任务和环境。
在一个机器学习模型中,很难有效地将众多来源的数据整合在一起,因此许多模型仅使用一种类型的数据来训练机器人。但是,以这种方式训练的机器人,在某些特定任务方面的数据相对较少,通常无法在不熟悉的环境中执行新任务。
研究人员此次改变策略,训练了一个单独的扩散模型,让它学习使用一个特定数据集来完成一项任务。然后,他们将扩散模型的学习策略组合成一个通用策略,使机器人能在各种设置中执行多项任务。
在模拟和真实世界的实验中,这种训练方法使机器人能使用多种工具,并适应训练期间没有学过的新任务。与基线技术相比,这种策略组合将任务性能提高了20%。
研究人员表示,解决机器人数据集中的异质性就像一个先有鸡还是先有蛋的问题。如果想使用大量数据来训练通用机器人,首先需要可部署的机器人来获取所有这些数据。利用所有可用的异质数据,类似于研究人员对ChatGPT所做的工作,是机器人领域发展的重要一环。