ICRA 24 | Sim-To-Real Learning for Humanoid Box Loco-Manipulation

作者: 布噜布噜你的头分类: 计算机技术发布时间: 2024-06-01 15:44:30 浏览:706 次

少务:
osu这个做的挺好，比某些玄学mpc要有意义多了[吃瓜]

【回复】回复 @少务 :Gradient加在哪？dynamics还是value function？
【回复】回复 @沉默是金啊 :嗯嗯，是这样的，建议你mpc里接个policy gradient，从td method, actor-critic一步到位到ppo-mpc
【回复】mpc是玄学 rl是determinstic？

机器人移动机械臂全身控制双足机器人人形机器人机器学习深度学习强化学习四足机器人最优控制

如果觉得我的文章对您有用，请随意打赏。您的支持将鼓励我继续创作！