ICRA 24 | Sim-To-Real Learning for Humanoid Box Loco-Manipulation
少务:
osu这个做的挺好,比某些玄学mpc要有意义多了[吃瓜]
【回复】回复 @少务 :Gradient加在哪?dynamics还是value function?
【回复】回复 @沉默是金啊 :嗯嗯,是这样的,建议你mpc里接个policy gradient,从td method, actor-critic一步到位到ppo-mpc
【回复】mpc是玄学 rl是determinstic?
机器人 移动机械臂 全身控制 双足机器人 人形机器人 机器学习 深度学习 强化学习 四足机器人 最优控制