ALOHA机器人:低成本双臂操作的革新者
ALOHA(A Low-cost Open-source Hardware for Agile Dexterous Manipulation)是一款低成本开源双臂操作平台,由斯坦福大学开发,后衍生出Mobile ALOHA(移动版),由谷歌DeepMind与斯坦福合作打造。
核心特点
1. 低成本高效能
- 硬件成本约2万美元,仅为专业研究机械臂(如Franka Emika Panda)的价格
- 采用ViperX和WidowX机械臂,搭配3D打印组件,实现高精度操作
- Mobile ALOHA整套系统(含电源和计算)约3.2万美元,性价比极高
2. 创新的操作与学习机制
主从控制架构:
- 操作者通过主控臂(主臂)实时控制执行臂(从臂),50Hz高频率响应,操作流畅自然
- 四路视觉系统(双腕+顶部+低位摄像头)提供全方位视野
ACT算法(核心技术):
- Action Chunking with Transformers,基于Transformer架构的动作分块算法
- 通过模仿学习,仅需50次演示即可掌握新技能,如穿拉链、开密封袋等精细操作
- 系统能将视觉输入与动作序列关联,预测并执行复杂任务
Mobile ALOHA:从桌面到全屋
移动版本的四大突破:
- 轮式移动底座:可在家庭环境中自由移动,速度与人步行相当
- 全身远程操控:不仅控制手臂,还能协调移动与操作,实现"边走路边做事"
- 独立供电:内置电池支持无外接电源工作,续航约数小时
- 全场景应用:从厨房(炒菜、摆盘)到客厅(整理、浇花),甚至能自主乘电梯、清洁洒出的液体
应用场景
| 场景 | 代表性任务 |
|---|---|
| 家庭服务 | 炒菜、洗碗、叠衣服、浇花、逗猫 |
| 生活协助 | 递物、握手、简单护理、开关门、按电梯 |
| 办公场景 | 整理文件、推椅子、取咖啡 |
| 研究平台 | 作为机器人学习研究的开源实验平台,已被哈工大等机构用于"机器脑"开发 |
技术原理简解
工作流程:
- 人类操作主臂演示任务(如插电池)
- 系统以0.02秒周期记录视觉数据+关节角度
- ACT算法将这些数据编码为动作序列模型
- 机器人可自主执行或优化这些动作,成功率达80-90%
开源与创新
ALOHA项目软硬件完全开源,为机器人爱好者和研究人员提供了宝贵资源:
- GitHub上提供完整代码,包括远程操作、数据记录和模型训练工具
- 社区已开发多种扩展,如ALOHA2(增强版),提升了耐用性和人体工学设计
- 全球研究团队基于此平台开发出更多AI应用,如通过语言指令直接控制(哈工大"机器脑")
总结
ALOHA机器人通过低成本硬件+创新算法,打破了双臂操作机器人的价格壁垒,使高端机器人技术走向普及。从最初的桌面操作到如今能在家庭环境中自由移动的Mobile ALOHA,它代表了服务机器人发展的重要里程碑——让AI真正走入日常生活。
注:本文信息主要基于2023-2025年斯坦福大学和谷歌DeepMind的研究成果及开源资料。