news 2026/2/14 18:47:51

枢途科技开源10万+轨迹具身数据集HORA

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
枢途科技开源10万+轨迹具身数据集HORA

枢途科技正式发布多模态具身智能数据集HORA,这是业界首个从真实场景人类视频中提取的具身多模态训练数据资源。

数据集包含15万条高质量轨迹,覆盖多种实际应用场景,支持更多具身从业者进行模型验证及机器人技能训练。

此次发布的数据集基于枢途科技自主研发的SynaData数采技术构建,该技术产出数据此前已成功应用于RDT、PI π0.5等主流开源模型,并与业内头部具身企业完成了商业化验证。

破解数据瓶颈:从人工采集到视频提取

当前,具身智能发展的核心制约在于高质量训练数据的稀缺与高成本。传统动作捕捉与遥操作技术虽然能实现一比一的动作复刻,但存在三方面关键问题:

  1. 成本高:人工成本及采集设备成本高企;数采设备成本可达数万至十几万元,大型数采中心的建设投入与运营投入巨大;

  2. 数据不通用:遥操作方式采集的数据通用性差,仅能支持部分构型机器人训练,容易形成“数据孤岛”;

  3. 模态不丰富:遥操作方式仅能采集到机械臂末端轨迹及视频数据,对于物体轨迹、Mesh等模态无采集能力。

枢途SynaData/RoboWheel开创了从人类真实工作视频及互联网视频中提取低成本、多模态训练数据的新路径,有效解决了行业的数采痛点。

技术突破:实现从人类视频到机器人指令的精准转化

HORA数据集的核心创新在于将人类操作视频转化为机器人可理解、可执行的训练数据。

该数据集采用HOI(人-物交互)格式,通过手和物体联合重建技术,生成物理合理的参数化结果,作为通用的上游模态,可灵活适配各种下游机器人本体。

在技术实现上,数据集展现出三大核心优势:

  1. 毫米级轨迹提取,将轨迹重建误差从传统方法的±5厘米显著降低至±0.5厘米;

  2. 跨本体适配,可泛化到不同机器人平台,实现“一次采集,多方使用”;

  3. 多模态支持,包含动作轨迹、物体网格、关节角度等丰富信息。

HORA数据集整合了超过15万条轨迹,融合了三类高质量数据源:真实场景RGB(D)录制数据、基于多视角动捕系统采集的带触觉信号数据以及公开HOI数据集后处理数据,形成了多源规模广泛与质量并重的数据体系。

该数据集既完整保留了手部参数、物体位姿、接触关系等HOI语义信息,也同步提供机器人视角观测、末端轨迹等机器人执行层所需的关键模态。其中,动捕子集所包含的高精度触觉信号,进一步为机器人学习精细操作提供了重要支持。

相较于现有数据集,HORA在规模与结构上均实现显著突破。传统HOI数据集如GRAB、HO3D等缺少可直接用于机器人训练的执行层数据;而DROID、LIBERO等机器人数据集则缺乏完整的交互语义信息;HORA有效弥合了这一断层,首次在统一框架内实现了从人类演示到机器人技能学习的端到端数据衔接,为具身智能的算法研发与模型训练提供了更加完整、可直接使用的数据基础。

开放生态:产业落地推动行业标准建设

枢途科技选择“数据基础设施第三方化”的开放路线,HORA数据集采用开源模式发布,将为高校科研团队和具身从业公司提供免费高质量训练数据,大幅降低模型训练成本。

目前,该数据集已适配所有主流VLA/IL模型。数据集采用通用标准格式,用户无需复杂格式转换即可直接用于模型训练。除数据集外,枢途科技还将发布基于该数据集训练开源模型的完整流程指南,帮助用户快速上手。

市场反馈

当前,枢途已与多家头部具身模型公司展开合作,进行数据送样与预训练验证。

市场反馈良好,HORA数据集在多个维度展现出卓越性能:在精度方面,当前数据集的轨迹重建精度达5毫米,满足多数工业场景需求;在泛化性方面,通过背景替换、桌面纹理变化等数据增强策略,提升了模型在复杂环境中的适应能力。

未来规划:构建亿条基建级数据生态

枢途科技将在今年内持续迭代增量数据集规模,目标成为全球最大的基于视频提取操作轨迹的具身数据集。

未来,公司将从三大方向拓展技术边界:

  1. 精度升级方面,引入动态遮挡建模与多视角重建机制,适配更广泛的分辨率范围和视频来源满足精度需求;

  2. 泛化扩展方面,支持的机器人本体类型将扩展至10种以上,并在多种本体上进行真机验证;

  3. 生态共建方面,与NVIDIA Isaac等仿真平台合作,建设完整的具身数据基础设施。

随着HORA数据集的开源,具身智能领域有望迎来新一轮创新浪潮。

枢途将持续为行业贡献数据燃料,赋能更多研发团队,枢途科技正推动行业向更加开放、协作的方向发展,为机器人在各行各业的规模化应用奠定坚实基础。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/4 23:16:58

Qwen-Image-Layered重新定义AI绘画:图层操作全解析

Qwen-Image-Layered重新定义AI绘画:图层操作全解析 1. 为什么传统AI修图总像在“碰运气” 你有没有试过让AI给一张生成好的人物图换件衣服?或者把风景照里的天空换成晚霞?结果大概率是:衣服边缘发虚、人物手部扭曲、背景出现奇怪…

作者头像 李华
网站建设 2026/2/7 0:10:51

2026毕业答辩前降AI工具推荐:答辩委员会都认可的5款

2026毕业答辩前降AI工具推荐:答辩委员会都认可的5款 TL;DR:2026毕业季来了,答辩前AI率检测成为必过关卡。本文推荐5款答辩委员会都认可的降AI工具:嘎嘎降AI(4.8元/千字,达标率99.26%)、比话降AI…

作者头像 李华
网站建设 2026/2/8 10:29:24

Cesium实战:构建智慧城市3D可视化平台

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 开发一个智慧城市可视化系统,要求:1) 集成Cesium和GeoJSON数据;2) 实现建筑物分层显示;3) 添加交通流量热力图;4) 支持多…

作者头像 李华
网站建设 2026/2/11 13:28:18

XFTP7入门指南:从安装到基本使用

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 开发一个交互式XFTP7学习助手,通过步骤引导帮助新手掌握基本操作。功能包括:1. 图文并茂的安装指南;2. 模拟连接服务器的交互式练习&#xff1b…

作者头像 李华
网站建设 2026/2/7 6:54:05

【Django毕设全套源码+文档】django基于web的中医药膳慢性病食疗平台的设计与实现(丰富项目+远程调试+讲解+定制)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/2/10 5:31:03

ZLIABARY镜像:AI如何加速镜像仓库的构建与管理

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个基于AI的Docker镜像生成工具,输入应用程序描述(如一个基于Python 3.9的Flask Web应用,需要MySQL数据库支持),自…

作者头像 李华