英伟达发布通用机器人模型RVT-2,训练效率提升6倍

7个月前 科技 42观看
摘要 随着AI技术的飞速发展,在工业和家庭领域中构建能够精确操作且仅需少量任务演示的通用实体机器人成为可能。例如,在工业制造中,人们希望实体机器人能够通过几次演示就学会高精度任务,如拧螺丝、搬

随着AI技术的飞速发展,在工业和家庭领域中构建能够精确操作且仅需少量任务演示的通用实体机器人成为可能。例如,在工业制造中,人们希望实体机器人能够通过几次演示就学会高精度任务,如拧螺丝、搬货物等。rYg喜好网-记录每日喜好的科技时尚娱乐生活

之前的PerAct、RVT等通用模型,在训练方面有一定的优势但还是有不少局限性。PerAct采用多任务模型,通过预测下一关键帧姿态来进行3D操作,但它使用的基于体素的场景表示限制了其扩展性。rYg喜好网-记录每日喜好的科技时尚娱乐生活

RVT虽然解决了PerAct的一些功能缺陷,但在处理需要高精度的任务时仍存在困难。所以,英伟达的研究人员在RVT基础之上研发出了第二代,训练效率比第一代快6倍,推理效率快2倍,仅10次示范学习就能执行各种高精度任务rYg喜好网-记录每日喜好的科技时尚娱乐生活

英伟达发布通用机器人模型RVT-2,训练效率提升6倍rYg喜好网-记录每日喜好的科技时尚娱乐生活

rYg喜好网-记录每日喜好的科技时尚娱乐生活

在架构方面与RVT相比,RVT – 2进行了大幅度改进并引入了多阶段推理管道。在处理对象非常小且需要非常精确的抓手姿态的任务时,例如,在孔中插入销钉,之前RVT使用的固定视图可能无法完成。rYg喜好网-记录每日喜好的科技时尚娱乐生活

RVT - 2采用了多阶段设计,在第一阶段使用固定视图预测感兴趣区域,然后在该区域进行放大并重新渲染图像,使用放大后的特写图像进行精确的抓手姿态预测。rYg喜好网-记录每日喜好的科技时尚娱乐生活

RVT – 2还采用了凸上采样技术。RVT基于ViT,在预测热图时,会将图像tokens特征上采样到图像分辨率,这一过程内存消耗大。rYg喜好网-记录每日喜好的科技时尚娱乐生活

英伟达发布通用机器人模型RVT-2,训练效率提升6倍rYg喜好网-记录每日喜好的科技时尚娱乐生活

RVT - 2去除了特征上采样,直接从tokens分辨率的特征预测热图形状,使用凸上采样层,通过学习到的凸组合来进行预测,不仅节省了内存,还不会牺牲性能。rYg喜好网-记录每日喜好的科技时尚娱乐生活

此外,RVT - 2对网络参数进行了合理化调整。RVT中一些网络参数,如虚拟图像大小和补丁大小,可能不是GPU友好的。RrYg喜好网-记录每日喜好的科技时尚娱乐生活

VT - 2采用了类似于ViT的参数,如224的图像大小和14的补丁大小,这不仅使神经网络更适合GPU,还减少了多视图变压器内部tokens的总数,进一步提高了效率。rYg喜好网-记录每日喜好的科技时尚娱乐生活

在旋转预测方面,RVT和PerAct使用全局视觉特征来预测末端执行器旋转,但当存在多个有效末端执行器位置且旋转依赖于位置时会出现问题。RVT - 2使用从末端执行器位置的特征图中汇集的局部特征进行旋转预测,实现了位置相关的旋转预测。rYg喜好网-记录每日喜好的科技时尚娱乐生活

RVT渲染场景点云时使用了五个虚拟相机,分别放置在正交位置。但在RVT - 2的多阶段模型中,研究发现仅使用三个视图就足够了,且不会牺牲性能。rYg喜好网-记录每日喜好的科技时尚娱乐生活

这是因为RVT - 2在最终预测中使用了放大后的视图,减少虚拟视图数量可以减少渲染器需要渲染的图像数量和多视图变压器需要处理的令牌数量,从而提高了训练和推理效率。rYg喜好网-记录每日喜好的科技时尚娱乐生活

英伟达发布通用机器人模型RVT-2,训练效率提升6倍rYg喜好网-记录每日喜好的科技时尚娱乐生活

为了评估RVT - 2的性能,研究人员在模拟和现实世界中进行了综合实验。在模拟实验中,使用了RLBench中的18个任务进行测试,包括推按钮、放置物品和需要高精度的插销等任务。每个任务有2到60个变化,如处理不同颜色或位置的对象rYg喜好网-记录每日喜好的科技时尚娱乐生活

实验结果表明,RVT - 2在训练时间和性能上显著优于之前的模型。在训练时间方面,RVT - 2在相同计算资源下比RVT训练效率快6倍,推理效率快2倍。rYg喜好网-记录每日喜好的科技时尚娱乐生活

在现实世界实验中,除了RVT中使用的堆叠方块、按压消毒器、将标记物放入杯子/碗中、将物体放入抽屉、将物体放入架子5个任务外,还增加了三个来自IndustRealKit的高精度任务,拾取并插入16mm销钉、拾取并插入8mm销钉、拾取并插入插头。rYg喜好网-记录每日喜好的科技时尚娱乐生活

英伟达发布通用机器人模型RVT-2,训练效率提升6倍rYg喜好网-记录每日喜好的科技时尚娱乐生活

实验结果显示,RVT - 2在5个来自RVT的任务中,比RVT的性能相对提高了12.5%。在所有3个新的高精度任务上,RVT - 2的平均成功率为53.3%,而RVT为33.3%。rYg喜好网-记录每日喜好的科技时尚娱乐生活

论文地址:https://arxiv.org/abs/2406.08545rYg喜好网-记录每日喜好的科技时尚娱乐生活

 rYg喜好网-记录每日喜好的科技时尚娱乐生活

 rYg喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
首发1999元 华硕ROG新款25寸显示器上市:FHD 310Hz屏

首发1999元 华硕ROG新款25寸显示

11月19日

11-19 111阅读
北上广深一线城市爱买啥车 北京喜欢比亚迪、上海广州更爱特斯拉

北上广深一线城市爱买啥车 北京

11月19日

11-19 110阅读
外媒:英伟达新款Blackwell AI芯片面临过热问题,或致数据中心部署延期

外媒:英伟达新款Blackwell AI芯片

11月1

11-19 105阅读
超204万人预约华为Mate 70:纯血鸿蒙+麒麟芯自研完全体来了

超204万人预约华为Mate 70:纯血鸿

11月19日

11-19 138阅读
“鲶鱼”雷军:抖音粉丝突破3000万,换一种方式卷同行?

“鲶鱼”雷军:抖音粉丝突破3000万

在流

11-19 97阅读
人民日报评代拍乱象, 代拍为何惹众怒?

人民日报评代拍乱象, 代拍

近期除了家暴一词被大家热议,代拍

11-19 110阅读
泰妍将在今天(18日)下午6点发布迷你六辑《Letter To Myself》

泰妍将在今天(18日)下午6

凭借《To. X》创造热潮的少

11-19 103阅读
《扫黑风暴》郑毅红结局是什么?她最后有没有落网?

《扫黑风暴》郑毅红结局是

电视剧《扫黑风暴》郑毅红结局是

11-19 114阅读
山东卫视《中华家庭诗词擂台赛》 共品大宋“战狼”辛弃疾的峥嵘岁月

山东卫视《中华家庭诗词擂

  “品诗词之美,传诗礼家风”,由山东

11-19 108阅读
电视剧《三大队》今日开播,秦昊演刑警队长程兵

电视剧《三大队》今日开播

由张译领衔主演,王骁、曹炳琨、魏

11-19 128阅读
《维纳斯璀璨假期 死或生XTREME》公开实机游玩

《维纳斯璀璨假期 死或生X

台湾光荣特库摩宣布,家机新作沉浸式恋爱

11-19 136阅读
三国群英传7秘籍大全_三国群英传7所有秘籍代码一览

三国群英传7秘籍大全_三国

三国群英传7游戏支持秘籍功能,玩家可以

11-19 146阅读
帝国时代3亚洲王朝秘籍_帝国时代3秘籍大全

帝国时代3亚洲王朝秘籍_帝

帝国时代3亚洲王朝(Age of Empires III:

11-19 139阅读
小小突击队礼包码,小小突击队周年礼包码2023.9

小小突击队礼包码,小小突击

小小突击队礼包码来啦!这次为大家带来的

11-19 108阅读
原神超越时间的虚影全流程解析|超越时间的虚影隐藏任务攻略

原神超越时间的虚影全流程

超越时间的虚影是原神须弥沙漠地区的隐

11-19 107阅读