麻省理工学院的研究人员开发出一种机器人训练方法,既能减少时间和成本,又能提高对新任务和新环境的适应能力。
这种方法被称为异构预训练转换器(HPT),它将来自多个来源的大量不同数据整合到一个统一的系统中,有效地创建了一种生成式人工智能模型可以处理的共享语言。在传统的机器人训练中,工程师通常会在受控环境中为单个机器人和任务收集特定数据,而这种方法与此大相径庭。
首席研究员、麻省理工学院电子工程与计算机科学研究生王立瑞认为,虽然许多人认为训练数据不足是机器人技术面临的主要挑战,但更大的问题在于存在大量不同的领域、模式和机器人硬件。他们的工作展示了如何有效地结合和利用所有这些不同的元素。
研究团队开发了一种统一各种数据类型的架构,包括摄像头图像、语言指令和深度图。HPT 利用类似于高级语言模型的变压器模型来处理视觉和本体感觉输入。
在实际测试中,该系统取得了不俗的成绩,在模拟和实际场景中均比传统训练方法高出 20% 以上。即使机器人遇到的任务与其训练数据大相径庭,这种改进也能保持不变。
研究人员组建了一个令人印象深刻的数据集进行预训练,该数据集由 52 个数据集组成,包含四个类别的 20 多万条机器人轨迹。这种方法可以让机器人从丰富的经验中学习,包括人类演示和模拟。
该系统的关键创新之一在于它对本体感觉(机器人对自身位置和运动的感知)的处理。该团队设计的架构对本体感觉和视觉同等重视,从而实现了更复杂的灵巧动作。
展望未来,该团队的目标是增强 HPT 处理无标签数据的能力,类似于高级语言模型。他们的最终设想是创建一个通用的机器人大脑,可以下载并用于任何机器人,而无需额外的训练。
虽然该团队承认他们的研究还处于早期阶段,但他们仍然乐观地认为,类似于在大型语言模型方面所取得的进展,扩展研究可能会带来机器人策略方面的突破性发展。
上一条: F5与英伟达联手提升人工智能和云安全