news 2026/4/27 22:12:46

达摩院开源具身大脑基模RynnBrain,首次让机器人拥有时空记忆

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
达摩院开源具身大脑基模RynnBrain,首次让机器人拥有时空记忆

达摩院开源具身大脑基模RynnBrain,首次让机器人拥有时空记忆

达摩院DAMO 达摩院DAMO2026年2月10日 11:42浙江

2月10日,阿里巴巴达摩院发布具身智能大脑基础模型RynnBrain,并一次性开源了包括30B MoE在内的7个全系列模型。RynnBrain首次让机器人拥有了时空记忆空间推理能力,智能水平实现大幅跃升,在16项具身开源评测榜单上刷新纪录(SOTA),超越谷歌Gemini Robotics ER 1.5等行业顶尖模型。

据介绍,具身模型的智能水平已成为行业发展的重要瓶颈,尤其是泛化能力亟待提升。业界形成了多条技术路线的探索:一类是动作模型,从机器人末端动作输出着手,发展出可以直接操作物理世界的VLA模型,但VLA模型往往因为数据稀缺难以实现泛化;另一类是大脑模型,从本身具有泛化能力的VLM等模型入手,但他们普遍缺乏记忆能力,动态认知受限,且普遍存在物理幻觉,难以支持人形机器人复杂的移动操作。

为了克服这些问题,达摩院的RynnBrain模型创造性地引入了时空记忆物理世界推理,这是机器人与环境互动所需的两项基本能力。时空记忆能力可让机器人在其完整的历史记忆中定位物体、目标区域,甚至预测运动轨迹,从而赋予机器人全局时空回溯能力物理空间推理不同于传统的纯文本推理范式,RynnBrain采用文本与空间定位交错进行的推理策略,确保其推理过程紧密扎根于物理环境,大大减弱了幻觉问题。举例来说,运行RynnBrain模型的机器人,在执行A任务中被突然打断要求先做B任务,它能记住A任务的时间和空间状态,等完成B后继续工作。

RynnBrain具有认知、定位、推理、规划等多重能力

RynnBrain在Qwen3-VL基础上训练,使用自研的RynnScale架构进行训练优化,同等资源加速两倍,训练数据超过2000万对。结果显示,RynnBrain能力全面,性能领先,在16项具身开源评测榜单上刷新纪录(SOTA),包括环境感知与对象推理、第一人称视觉问答、空间推理、轨迹预测等,超越了谷歌Gemini Robotics ER 1.5、英伟达 Cosmos Reason 2等具身顶尖模型。

RynnBrain在16项具身评测上实现SOTA

RynnBrain还拥有良好的可拓展性,能够快速后训练出导航、规划、动作等多种具身模型,有望成为具身行业的基础模型。以具身规划模型为例,其需要强大预测能力和场景解析能力,但基于RynnBrain为基础,只需几百条数据微调,效果就能超越Gemini 3 Pro,轻松实现SOTA。

以开源完整的推理与训练代码的方式,达摩院此次开源了RynnBrain全系列模型,共计7个,包含全尺寸基础模型与后训练专有模型,其中有业界首个MoE架构的30B具身模型,只需要3B的推理激活参数就能超越业界的72B模型效果,因此能让机器人动作更快、更丝滑。同时,达摩院还开源了全新评测基准 RynnBrain-Bench,用于评测时空细粒度具身任务,填补了行业空白。

RynnBrain模型架构

达摩院具身智能实验室负责人赵德丽表示:“RynnBrain 首次实现了大脑对物理世界的深度理解与可靠规划,为大小脑分层架构下的通用具身智能迈出关键一步。我们期待它加速 AI 从数字世界走向真实物理场景的落地进程。”据了解,达摩院积极投入具身智能,正在构建可部署、可扩展、可进化的具身智能系统,已开源了融合世界模型和VLA模型的WorldVLA、世界理解模型 RynnEC等具身模型,以及业界首个机器人上下文协议 RynnRCP。

,时长00:13

能够识别主要物体并在主要物体移动下保持对其空间位置的记忆

,时长00:18

能在面临三个面包分两个盘子的难题时找到分配方法

,时长00:11

能够认知之前被喝过的矿泉水,并在复杂的变换中始终保持对物体的记忆

,时长00:14

能够根据用户需求推荐物品,并根据观察物品的文字标签选择出合适的物品

,时长00:41

能够对杂乱的桌面进行分拣规划,以及在被打断后依旧有记忆之前的任务处理到哪里

更多详情可点击以下链接:

github:https://github.com/alibaba-damo-academy/RynnBrain

huggingface: https://huggingface.co/collections/Alibaba-DAMO-Academy/rynnbrain

主页:https://alibaba-damo-academy.github.io/RynnBrain.github.io/

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/25 16:08:24

excel快速输入时间的快捷键

在 Excel 中,输入当前时间的标准快捷键是:Ctrl Shift ;​ (按住 Ctrl 和 Shift 键,再按分号键)这个快捷键会在选定的单元格中插入 当前时间。重要提示与相关快捷键:快捷键功能说明Ctrl Shift ;​插入当…

作者头像 李华
网站建设 2026/4/21 23:24:12

多云环境下的配置一致性危机与GNN破局之道

随着企业多云架构复杂度激增(平均部署3.7个云平台),资源配置差异导致的故障率提升40%。传统基于规则引擎的检测工具面临三大瓶颈: 拓扑关联缺失:无法捕捉资源间动态依赖(如AWS S3与Azure VM的访问链路&…

作者头像 李华
网站建设 2026/4/26 17:48:14

ICG-DOTA-NHS酯,ICG-DOTA SE荧光标记的关键“桥梁”

试剂基本信息中文名称:ICG-DOTA琥珀酰亚胺酯;吲哚菁绿-DOTA 琥珀酰亚胺酯英文名称:ICG-DOTA Succinimidyl Ester;ICG-DOTA SE;ICG-DOTA NHS ester分子量:1536.77激发波长:789发射波长&#xff1…

作者头像 李华
网站建设 2026/4/17 17:51:13

‌脚本质量门禁:CodeBERT在自动化代码坏味道检测的规则引擎‌

技术债治理——软件测试内容的新热点 2026年,软件测试从业者的核心痛点已从基础工具使用转向技术债务治理。据行业观察,讨论代码坏味道自动化检测与AI驱动重构的内容阅读量同比激增67%,其中结合规则引擎优化与AI模型落地实践的文章最易引发共…

作者头像 李华
网站建设 2026/4/26 19:55:23

小白程序员必看!收藏这份AI大模型应用开发学习路线,轻松入门

AI正成为2025年的热门领域,本文为后端开发者提供了转岗AI大模型应用开发的完整学习路线,涵盖大模型基础、RAG应用开发、大模型Agent应用架构及微调与私有化部署等阶段。强调AI应用的核心逻辑在于设计Prompt和结合业务逻辑,而非复杂的算法研究…

作者头像 李华
网站建设 2026/4/22 1:13:18

2026年EOR名义雇主服务TOP5推荐榜单:揭晓灵活用工的最佳优势与解决方案

EOR名义雇主服务在企业的灵活用工方案中扮演着愈发重要的角色。这种服务允许公司在全球范围内招聘人才,而无需设立法律实体,从而大幅降低了进入新市场的复杂度。EOR名义雇主可负责法律合规、税务处理和薪资发放等繁杂事宜,确保企业遵守当地法…

作者头像 李华