Route
Contact us
2025-01-05 21:50:42
开云体育,开云体育官方,开云app下载,开云体育靠谱吗,开云官网
在此基础上,他们提出了一套新颖的算法框架——ManiBox,让机器人能够在真实世界中应对多样化的物置和复杂的场景布置。
在实际测试中,ManiBox实现了34440cm⊃3;最大操作空间范围的高效覆盖,抓取成功率高达90%-100%。
在具身智能和机器人操作实验室中,往往会选择固定的setting进行实验,在业内被称为“完美摆放位置”。
但在现实环境中,实现机器人的空间泛化,以应对多样化的物置和复杂的场景布置,一直是个艰难的挑战。
显然,实现空间智能所需要的,绝不是只在实验室中操作一块极小的空间范围内的物体。
为此,研究团队基于发现的具身智能的空间泛化性Scaling Law,推出了ManiBox这项成果。
ManiBox是一个创新性的机器人操作算法框架,深入探索了具身智能的空间泛化性的Scaling Law,并通过大量模拟器数据和Bounding Box这样的视觉低维特征引导,成功实现了空间泛化、背景泛化和物体泛化的抓取任务。
除了开头展示的34440cm⊃3;空间泛化之外,ManiBox还实现了物体和背景的泛化。
物体方面,无论是苹果、钢杯,还是玻璃烧杯,ManiBox对各种形状、大小的物体都能精准抓取。
同时面对各种背景挑战,无论是不同颜色桌布、复杂桌面,还是动态光源和视频干扰,ManiBox始终表现稳定。
除了这几个泛化维度,ManiBox的强大适应性还让其轻松扩展至复杂操作任务,并在真实环境中成功完成了抓取半空中物体、杂乱桌面上的物体,甚至倒水等操作。
除了抓取之外,通过修改teacher policy,还能实现向不同瓶子中倒水的操作,精准调整角度与力度,并实现平稳且可控的液体倾倒:
另外作者的实验还表明,即使在视觉遮挡率高达40%或Bounding Box识别噪音高达5%的情况下,ManiBox依然展现强大的鲁棒性和操作能力。
即便在黑暗环境下,检测模型大部分时间下没有检测到目标物体,纯靠策略的泛化性,机械臂也能精准完成抓取任务:
通过下面的这组图片,可以看到ManiBox确实只有少数时间检测模型检测到了目标物体。
可以看出,ManiBox不仅能够完成常规抓取,还能扩展到更复杂的任务,适应不同的精细操作场景,展现了出色的Sim2Real能力。
并且这些动作,用户只需输入一个物体的prompt,ManiBox即可自动执行对应物体的抓取、倾倒等操作,显著提升了机器人操作任务的鲁棒性与灵活性。
一是利用规模化(scalable)、自动化的action数据生成方式,来在策略模块上进行训练,形成模型对action的认知,以缓解action模态数据稀缺的问题。(对应生成action的Policy)
二是充分利用互联网级别的数据量(internet-scale data),在视觉、文本模态上形成通用的模型,来提供完成任务的重要指示信息。(对应Bounding Box这样的低维视觉特征及其背后的视觉模型)
ManiBox深入探索了具身智能的空间泛化性Scaling Law,首次揭示了操作任务中的两大关键关系。
一方面,团队发现任务的成功率与数据量呈现出米氏-曼特恩(Michaelis-Menten)动力学曲线:
成功率达到80%-90%之后,数据量即使再继续增加,模仿学习策略的成功率也逐渐趋于饱和,上升缓慢;
另一方面,作者还发现空间泛化所需数据量与空间体积呈现幂律关系,即更多数据可显著提升更大空间范围内的泛化能力:
在理论的基础之上,ManiBox通过policy generalization方法来有效解决了空间泛化性问题,确保策略能够在多样化的环境,即便视觉模型存在较大的不确定性中,也能表现出强大的适应性。
借助YOLO-World这样的开集边界框检测模型,ManiBox精准提取多视角的低维空间信息,将复杂的高维视觉问题转化为简化的状态建模问题,从而为策略训练提供了坚实的基础。
最终,通过训练一个基于状态的策略(state-based policy),实现了从仿真到真实世界的高效迁移。
同时结合随机掩码(random mask)技术和历史轨迹信息,ManiBox显著提升了策略在应对视觉噪声和检测失败场景下的鲁棒性,进一步加强了模型的泛化能力和在真实环境中的表现。
教师策略:通过强化学习与模仿学习相结合的框架,ManiBox可以做到2h训练完强化学习策略,仅用一天时间 自动化采集了36,000条高质量模拟数据,涵盖多种物体形状、大小和空间配置;
学生策略:在此数据上训练,仅需2分钟即可完成模型学习,达成零样本迁移,在真实场景中高效部署;
基于强化学习的操作策略,相比传统的视觉方法可以有更强大通用性和鲁棒性,比如传统的视觉方法需要利用IK(逆运动学)求解joint position。
ManiBox的推出不仅为机器人操作任务提供了一种高效可靠的解决方案,更定义了一种 “数据驱动的空间智能” 方法,让机器人在复杂真实场景的实用性成为可能。
它为机器人在复杂真实场景中的表现奠定了理论和技术基础,具有广泛的工业与家庭应用潜力。
一位是清华大学计算机系TSAIL实验室的二年级博士生谭恒楷(Hengkai Tan),主要研究方向是具身智能和强化学习,此前在ICML等顶级会议发表论文,还曾是全国青少年信息学奥林匹克竞赛(NOI)的银牌,全国84名,他也是RDT大模型的作者之一。
另一位是新加坡国立大学数学系大四本科生徐学舟(Xuezhou Xu),研究兴趣在于具身智能和强化学习,他曾参与关于跨本体预训练的研究项目PEAC,该研究已被NeurIPS2024接收。
PEAC提出了跨本体无监督预训练CEURL,在多个本体上统一预训练,从而控制多个本体快速适应下游任务,实现了真实世界机器狗不同关节失灵的运动控制。
ManiBox延续了作者此前工作的类似思想,即利用规模化、自动化的action数据生成方式来训练策略,实现策略的泛化性。
作者发表在ICML2024上的FCNet在2023年实现了四足机器狗在真实世界极端地形的行走,包括过膝深的雪、结冰的河面、乱石、45度坡、楼梯等,同时有着更低的续航、更高的推理效率和更高的数据效率。
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。
搜索您想要找的内容!
地址:开云体育平台永久网址【wdhash.cc】 电话:wdhash.cc 手机:wdhash.cc
Copyright © 2012-2024 开云体育网站 版权所有 非商用版本 ICP备案编号: