近年来,通用具身智能领域的发展呈加速态势,高质量数据作为具身智能领域研究阶段的重要资源,直接影响着该领域的研究进展。12月30日,作为中国具身智能领域的领军企业,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,共同发布了全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集——智元世界AgiBot World。
该数据集旨在构建国际领先的开源技术底座,通过汇聚顶尖资源与技术力量,让各方共同推动具身智能发展新范式,加速人类迈向通用人工智能的新时代,在全球范围内奠定中国在这一前沿领域的领导地位。
AgiBot World的发布,无疑为具身智能领域的研究者们带来了一场及时雨。在此之前,尽管谷歌DeepMind等巨头已经推出了Open X-Embodiment等数据集,但这些数据集在数据质量、采集流程以及场景覆盖面等方面仍存在诸多不足。相比之下,AgiBot World不仅在数据规模上远超前者,长程数据规模高出10倍,场景范围覆盖面扩大100倍,数据质量也从实验室级上升到工业级标准。
在数据集的内容上,AgiBot World收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程,双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。这些技能的精准实现,离不开智元机器人在数据采集、处理和质量控制方面的深厚积累。
高质量数据离不开全域真实场景,AgiBot World 诞生于智元机器人自建的大规模数据采集工厂与应用实验基地,涵盖了家居、餐饮、工业、商超和办公五大核心场景。这些场景不仅真实复刻了机器人在生产、生活中的典型应用需求,更为机器人提供了一个高度真实的生产生活环境。通过多场景的高度还原与任务设计,AgiBot World为机器人研发和测试构建了实现具身智能的必要条件。
场景和任务分布 各个场景物品分类
数据集时长分布
值得一提的是,AgiBot World不仅在数据质量和场景多样性上表现出色,更在硬件配置上实现了全面升级。数据集采集所依托的机器人平台配备了8个摄像头环绕式布局,能够实时全方位感知周围环境的动态变化。同时,机器人还具备6个主动自由度的灵巧手,能够完成熨衣服等多种复杂操作。此外,全身最高32个自由度,末端六维力传感器和高精度视触觉传感器的配备,更是让机器人在面对精细操作任务时能够有条不紊,从容不迫。
为了确保数据的高质量,智元机器人在AgiBot World的采集过程中采取了多级质量把控和全程人工在环的策略。从采集员的专业培训,到采集过程中的严格管理,再到数据的筛选、审核和标注,每一个环节都经过了精心设计和严格把控。此外,智元机器人还邀请了学术界、工业界和消费者等多方视角进行任务设计把关,以确保任务更加贴近真实的工作和生活场景。
随着AgiBot World的发布,智元机器人同时宣布了一系列后续计划。其中包括百万真机全量数据的陆续开源、千万仿真数据的同步推送、具身基座大模型的发布以及全套工具链的推出等。这些行动将进一步推动国内通用具身智能领域研究朝着体系化、专业化方向发展。
可以预见的是,AgiBot World的发布将对中国乃至全球具身智能领域的发展产生深远影响。它不仅为研究者们提供了一个宝贵的数据资源,更为加速人类迈向通用人工智能的新时代提供了有力支撑。在这个充满机遇和挑战的新时代里,我们有理由相信,智元机器人将继续发挥其在具身智能领域的领军作用,为推动机器人融入人类社会贡献更多智慧和力量。