宇树G1人形机器人习得少林功夫？揭秘BeamDojo强化学习框架-AITOP100,AI资讯

人形机器人“苦练”少林功夫？G1平衡挑战引关注

继跳舞视频引发AI质疑后，宇树G1人形机器人又展示了新的技能——在梅花桩和平衡木上行走，动作流畅稳定，宛如习得了少林功夫，引发网友热议。

这一突破性进展的背后，是上海AI实验室、上海交通大学、浙江大学、香港大学、香港中文大学联合发布的一项重要成果：BeamDojo强化学习框架。该框架是首个基于学习的方法，能让人形机器人在落脚点稀疏的复杂地形上实现精细的落脚点控制。

在诸如踏脚石、平衡木等落脚点稀疏的地形上行走，对机器人腿部运动是巨大的挑战。机器人需要精确处理感知信息，在安全区域内精准放置脚步，并在此过程中保持身体的稳定，才能实现灵活安全的移动。

传统方法难以直接应用于人形机器人，主要面临以下两大技术难点：

四足机器人在类似地形上的成功经验难以直接移植。四足机器人通常采用点状脚，而人形机器人的脚部通常为多边形。为点状脚设计的落脚点奖励机制并不适用于多边形脚。
基于学习的人形机器人运动研究在复杂地形和精细落脚点上的灵活运动方面仍存在问题。用于评估脚步放置的奖励信号通常非常稀疏，导致学习过程效率低下，难以获取可靠的感知信息。

为了解决这些难题，研究团队开发了BeamDojo强化学习框架，使人形机器人能够在稀疏落脚点上实现灵活的移动。

在演示中，G1能够稳定地穿越多个宽度仅约20厘米、间距不一的踏脚石，甚至可以倒退着穿越。

宽度同样为20厘米的平衡木挑战对它来说也不在话下。

在平衡性方面，即使背负6千克重物或受到外部干扰，G1依然能够很好地穿越这些复杂地形。

有网友评论说，这简直就像是人形机器人到少林寺进修，展示了中国功夫片的场景。

据Huayi Wang介绍，BeamDojo框架主要有以下创新点：

两阶段强化学习训练策略： 提高机器人学习效率。第一阶段在平地上进行训练，通过输入地形参数让算法在安全环境中预学习；第二阶段切换至实际任务地形中进行策略优化。
基于采样的落脚点奖励机制和“双评价器”架构： 为多边形脚掌量身定制，平衡密集移动奖励和稀疏落脚点奖励之间的学习过程。
搭载基于激光雷达的高程地图系统： 使机器人能够实时感知地形细节，为精准落脚提供数据支持。
零样本泛化能力： G1在训练过程中从未接触过稀疏地形与平衡木，但却能对各类稀疏落脚点地形做到零样本泛化。

实验结果表明，BeamDojo在模拟环境中实现了高效学习。在现实世界中，该框架也能让人形机器人在稀疏落脚点上精准落脚并灵活移动，即使受到较大的外部干扰，也能保持较高的成功率。此外，该技术还可以应用于诸如沟壑等更具挑战性的复杂地形中。

更多AI行业最新资讯新闻信息请关注AI 人工智能网站--AITOP100平台--AI资讯专区：https://www.aitop100.cn/infomation/index.html