4 月 10 日,灵初智能正式发布新一代具身大模型 Psi-R2 与 Psi-W0,并宣布开源首批 1000 小时人类手部操作全模态数据集。该数据集总储备达 10 万小时,为当前行业最大的开源人类手部操作数据集,标志着具身智能从实验室走向产业化的关键一步。
Psi-R2 是首个使用 10 万小时量级人类数据预训练的 World Action Model,输入图片和语言即可输出预测的未来视频和机器人动作。基于"The Bitter Lesson"理念,模型直接通过运动学将人类关节与机器人对齐,让模型从海量数据中自主学习。实验表明,仅需不到 100 条轨迹的真机数据微调,即可完成手机装配、工业包装、叠纸盒等长程精细操作,大幅降低企业部署成本与落地周期。
Psi-W0 作为 Action-Conditioned World Model,核心功能是对 Policy 进行评估与提升,并通过强化学习将人类数据的 dynamic 迁移至机器人 dynamic,与 Psi-R2 形成数据飞轮:在 Psi-W0 中微调生成机器人数据,筛选高质量数据重新加入训练,实现能力持续迭代提升,完成从人类经验到机器人能力的快速转化。