news 2026/6/19 21:15:01

阿里达摩院发布具身智能大脑基础模型 RynnBrain:首次赋予机器人时空记忆与物理推理能力

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
阿里达摩院发布具身智能大脑基础模型 RynnBrain:首次赋予机器人时空记忆与物理推理能力

2026年2月10日,阿里巴巴达摩院正式发布其自主研发的具身智能基础模型RynnBrain,并同步开源包含30B MoE 架构模型在内的7个全系列模型,以及全新评测基准RynnBrain-Bench。这一发布标志着具身智能从“动作执行”迈向“认知理解”的关键一步。

两大核心能力:时空记忆 + 物理空间推理

传统具身模型常因缺乏长期记忆而“健忘”,或因脱离物理上下文而产生“幻觉”。RynnBrain 针对性地引入两项基础能力:

  • 时空记忆能力:使机器人能在完整历史轨迹中回溯物体位置、目标区域乃至运动路径,实现全局状态感知。例如,当执行任务A时被临时打断去处理任务B,RynnBrain 能准确记住任务A中断时的空间坐标与时间上下文,并在完成后无缝恢复。

  • 物理空间推理机制:摒弃纯文本推理范式,采用文本描述与空间定位交错进行的策略,确保每一步推理都锚定于真实环境,显著降低幻觉风险 。

技术底座:基于 Qwen3-VL,训练效率翻倍

RynnBrain 在Qwen3-VL 视觉语言模型基础上构建,采用达摩院自研的RynnScale 训练架构,在同等算力资源下训练速度提升2倍。模型训练使用超过2000万对高质量具身交互数据,其中包括专门生成的100万对“第一人称视角”OCR问答数据,用于提升对药瓶标签、门牌号等细粒度物理信息的理解能力 。

性能全面领先:16项SOTA,超越谷歌与英伟达

在权威评测中,RynnBrain 在16项具身开源榜单上刷新纪录(SOTA),涵盖:

  • 环境感知与对象推理
  • 第一人称视觉问答(FPVQA)
  • 三维空间推理
  • 运动轨迹预测

其综合性能已超越谷歌 Gemini Robotics ER 1.5英伟达 Cosmos Reason 2等国际顶尖模型 。

极致高效:30B MoE 模型仅激活 3B 参数

此次开源的RynnBrain-30B-MoE是业界首个采用混合专家(MoE)架构的具身大模型。尽管总参数达30B,但推理时仅激活约3B参数,即可超越72B稠密模型(如Pelican-VL)的效果,大幅降低硬件成本,同时提升机器人动作响应速度与流畅度 。

强可扩展性:数百条数据即可微调出SOTA专用模型

RynnBrain 具备优异的迁移能力。以具身规划任务为例,仅需几百条后训练样本微调,即可获得超越Gemini 3 Pro的性能,轻松达到SOTA水平。这使其有望成为导航、操作、任务规划等下游应用的统一基础模型 。

开源生态:模型 + 基准 + 代码全开放

达摩院此次不仅开源全部7个模型(含基础版与专用版),还发布了RynnBrain-Bench评测基准,首次系统支持时空细粒度具身任务评估,填补行业空白 。

达摩院具身智能实验室负责人赵德丽表示:“RynnBrain 首次实现了大脑对物理世界的深度理解与可靠规划,为‘大小脑分层架构’下的通用具身智能迈出关键一步。”

随着 RynnBrain 的全面开源,具身智能正加速从实验室走向工厂、厨房、物流等真实场景,推动 AI 真正“走进物理世界”。

大模型相关课程:

11.大模型的发展与局限性
21.1 ollama本地快速部署deepseek
31.2 linux本地部署deepseek千问蒸馏版+web对话聊天
41.3 linux本地部署通义万相2.1+deepseek视频生成
51.4 Qwen2.5-Omni全模态大模型部署
61.5 Stable Diffusion中文文生图模型部署
71.6 DeepSeek-OCR部署尝鲜
82.1 从零训练自己的大模型概述
92.2 分词器
102.3 预训练自己的模型
112.4 微调自己的模型
122.5 人类对齐训练自己的模型
133.1 微调训练详解
143.2 Llama-Factory微调训练deepseek-r1实践
153.3 transform+LoRA代码微调deepseek实践
164.1 文生图(Text-to-Image)模型发展史
174.2 文生图GUI训练实践-真人写实生成
184.3 文生图代码训练实践-真人写实生成
195.1 文生视频(Text-to-Video)模型发展史
205.2 文生视频(Text-to-Video)模型训练实践
216.1 目标检测模型的发展史
226.2 YOLO模型训练实践及目标跟踪
231.1 Dify介绍
241.2 Dify安装
251.3 Dify文本生成快速搭建旅游助手
261.4 Dify聊天助手快速搭建智能淘宝店小二
271.5 Dify agent快速搭建爬虫助手
281.6 Dify工作流快速搭建数据可视化助手
291.7 Dify chatflow快速搭建数据查询智能助手
302.1 RAG介绍
312.2 Spring AI-手动实现RAG
322.3 Spring AI-开箱即用完整实践RAG
332.4 LlamaIndex实现RAG
342.5 LlamaIndex构建RAG优化与实践
352.6 LangChain实现RAG企业知识问答助手
362.7 LangChain构建RAG企业知识问答助手实践
373.1 agent核心功能与概念
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/17 19:25:14

1.1 《Life 3.0》没白看 AI 正在从工具变成员工

1.1 《Life 3.0》没白看:AI 正在从「工具」变成「员工」 本节学习目标 借助《Life 3.0》的视角,建立「AI 从工具到智能体」的认知框架。 理解为什么 Agent 代表的是「会干活儿的 AI」,而不仅是「会答题的 AI」。 为后续「什么是 Agent、怎么造 Agent」打好观念基础。 一、为…

作者头像 李华
网站建设 2026/6/15 14:46:23

朱敬一挥毫开运马年 解锁国潮文化共振

在马年新春到来之际,得物 App 于上海虹口文化地标今潮 8 弄举办“马上开运”线下潮流活动。活动现场,国潮书法场景开创者朱敬一受邀亮相,以一场极具张力的现场书法创作,将传统书法与青年潮流文化紧密连接,成为本次活动…

作者头像 李华
网站建设 2026/6/12 15:14:54

Java语言提供了八种基本类型。六种数字类型【函数二十一】

变量就是申请内存来存储值。也就是说,当创建变量的时候,需要在内存中申请空间。 内存管理系统根据变量的类型为变量分配存储空间,分配的空间只能用来储存该类型数据。 因此,通过定义不同类型的变量,可以在内存中储存整…

作者头像 李华
网站建设 2026/6/13 0:49:32

[硬核运营] 告别手动搬运!浅析如何用 Python+RPA 打造“1688 批量采集 -> 智能清洗 -> 自动上架”的无人值守流水线

1688采集 跨境电商RPA 自动上架 数据清洗 ETL技术 铺货模式 自动化工具前言在跨境电商(TikTok Shop, Temu, Amazon, Shopify)的“唯快不破”时代,铺货速度 往往决定了你能否抢到新品的第一波红利。绝大多数卖家的供应链源头都在 1688。但是&a…

作者头像 李华
网站建设 2026/6/13 18:41:09

CANN Runtime:AI 处理器的运行核心与计算编排中枢

CANN 组织链接: https://atomgit.com/cann runtime 仓库链接: https://atomgit.com/cann/runtime 在异构计算架构中,硬件的强大性能需要高效的软件来激活和管理。对于 AI 处理器而言,CANN Runtime 正是扮演着这一关键角色。作为 C…

作者头像 李华
网站建设 2026/6/15 17:50:47

实操教程:c盘分区小了怎么扩大?分享3种分区扩容方法

看着任务栏里那个刺眼的C盘红色警告条,系统频繁弹出的“磁盘空间不足”提示,这不仅会影响电脑的运行速度,甚至可能导致软件无法安装或系统崩溃。c盘分区小了怎么扩大?针对这个问题,本文会分享多种适合不同水平用户的解…

作者头像 李华