我愿称之为B站最通俗易懂的深度强化学习PPO算法教程,计算机博士倾囊相授强化学习算法知识!
zhanlzx:
讲的挺好的,就是声音听着好难受,我的问题
[笑哭]
【回复】我也觉得难受,感觉好想锤这个老师好好活到毕业:
废话太多了,我开3倍速还觉得没啥信息量黑芝麻糊不好吃:
代码:https://github.com/BlackMirean/PPO,照着视频抄的[脱单doge]已是fw求自律:
我想知道ppo算法的AC框架的c网络有啥用[doge]他的奖励值都算好了已经
【回复】回复 @岁月难得一趟 :已经会了在研究多智能体了,参数真的难调
【回复】求平均啊,你在无穷的概率里想求一个平均,只能用神经网络来估计一个平均值
【回复】回复 @Eiee_ : 哈哈哈,me too大数据狂人:
白嫖课程资料+60G入门到进阶AI资源包+论文指导+kaggle组队+就业指导+技术问题答疑[给心心]
【回复】这个是完整的视频嘛,还有后续这个老师的视频嘛
【回复】关注vx公众:咕泡AI,回复211 获qu[热词系列_干杯]
人工智能 程序员 神经网络 考研最后冲刺 PPO算法 机器学习 计算机视觉 深度学习 强化学习 计算机专业