news 2026/5/7 2:54:34

什么是 DualTHOR?用于提高双臂机器人实际适应能力的新一代模拟器

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
什么是 DualTHOR?用于提高双臂机器人实际适应能力的新一代模拟器

摘要

本文提出了一个高精度模拟平台 DualTHOR,用于模拟双臂仿人机器人在现实世界中执行任务的情况,并评估其规划能力和鲁棒性。许多传统模拟器都是围绕轮式或单臂机器人设计的,往往会忽略物理不确定性和可能出现的故障。这限制了它们在现实世界中的应用。

DualTHOR 是对 AI2-THOR 的扩展,具有双臂机器人(Unitree H1 和 Agibot X1)的多种任务套件、基于物理的逆运动学、连续运动控制以及 “执行过程中的故障(如断裂、溢出)模拟应急机制”。这种机制使代理能够弥合计划期间的意图与现实中的不确定性之间的差距,并有望培养出高度适应现实世界的代理。

此外,还使用最新的视觉语言模型(VLM)进行了基线评估,结果表明当前模型在处理双臂任务和不确定性方面仍存在挑战。

建议的方法

DualTHOR 遵循 AI2-THOR 的基本设计,但假定是一个仿人双臂机器人。它由三个主要部分组成。

首先是双臂任务的专用任务设计。它定义了大量需要复杂操作的家庭任务,假定单臂难以完成的动作(例如,一手拿杯,一手倒水)。任务分为 “双臂强制任务”、"双臂可选任务 "和 “单臂任务”,这种设计增强了模型的通用性和灵活性。

其次是物理连续动作控制。在 X1 和 H1 中,IK 的配置不同,X1 提供单臂控制,而 H1 则提供全身协调的双臂控制。

第三是应急机制。每个动作都有一定的失败概率(如杯子打碎、液体溢出),因此模型需要制定恢复计划。通过这一机制,可以对模型进行评估,包括评估其在计划失败时的重建能力。

实验

在实验中,使用 GPT-4o 和 Gemini 1.5 Pro 等大型 VLM、Qwen2.5-VL 等开放式模型以及 DAG-Plan 等结构化提示对包含 10 个不同房间、68 个对象和 356 个任务的模型进行了评估。

评估分为 “双臂强制”、"双臂可选 "和 "单臂 "三个类别,另外还有三个难度级别(简单、中等和困难)和不同的行为成功率,以比较各种条件下的成功率。

结果表明,现有的 VLM 在所有类别的双臂基本任务中成功率都很低,尤其是在复杂任务和意外情况下,性能明显降低。例如,即使使用 DAG-Plan,双臂任务的成功率也只有 40% 左右,而且还发现了对动态重新规划和手臂相互干扰处理不当的例子。

实验还使用了 “连续物理渲染”(例如,描绘水的逐渐积累),以检查 VLM 是否能够跟踪视觉变化并更新其理解和规划。通过这样的设计,DualTHOR 揭示了当前技术的局限性,并对 VLM 的未来发展提出了明确的挑战。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/3 5:58:00

Zen Browser 5大隐藏功能终极指南:解锁高效浏览新境界

Zen Browser 5大隐藏功能终极指南:解锁高效浏览新境界 【免费下载链接】desktop 🌀 Experience tranquillity while browsing the web without people tracking you! 项目地址: https://gitcode.com/GitHub_Trending/desktop70/desktop &#x1f…

作者头像 李华
网站建设 2026/5/1 8:06:58

移动端编程革命:VS Code在平板和手机上的完整开发指南

移动端编程革命:VS Code在平板和手机上的完整开发指南 【免费下载链接】vscode Visual Studio Code 项目地址: https://gitcode.com/GitHub_Trending/vscode6/vscode 引言:当编码遇见移动化 想象一下这样的场景:你在咖啡馆等待朋友&a…

作者头像 李华
网站建设 2026/5/2 2:31:50

外定点式应变传感光缆

产品描述外定点式应变传感光缆是一种专业BOTDR和BOTDA原理研究的一种应力、应变传感光缆,光缆由中心的紧包型应变传感光纤铠装保护层热塑性外护套组成。光纤与铠装层处于自由活动状态,再通过一定间距对应力传感光纤与铠装层和外护套进行固定,从而实现空间非连续非均…

作者头像 李华
网站建设 2026/5/6 3:56:40

AI工程终极指南:产品运营3天快速上手方案

AI工程终极指南:产品运营3天快速上手方案 【免费下载链接】aie-book [WIP] Resources for AI engineers. Also contains supporting materials for the book AI Engineering (Chip Huyen, 2025) 项目地址: https://gitcode.com/GitHub_Trending/ai/aie-book …

作者头像 李华
网站建设 2026/5/1 1:26:50

从零开始掌握Geodesy:JavaScript地理坐标计算的终极指南

想要在项目中精确计算两个地理位置之间的距离吗?或者需要将经纬度转换为UTM坐标系统?geodesy库正是你需要的强大工具!这个JavaScript库提供了丰富的地理坐标计算功能,让你轻松处理各种地理空间数据需求。 【免费下载链接】geodesy…

作者头像 李华
网站建设 2026/4/22 11:37:25

LosslessCut时间码偏移终极指南:彻底解决音视频同步难题

LosslessCut时间码偏移终极指南:彻底解决音视频同步难题 【免费下载链接】lossless-cut The swiss army knife of lossless video/audio editing 项目地址: https://gitcode.com/gh_mirrors/lo/lossless-cut 问题诊断:为什么视频音频会不同步 音…

作者头像 李华