我愿称之为B站最通俗易懂的深度强化学习PPO算法教程，计算机博士倾囊相授强化学习算法知识！

作者: 大数据狂人分类: 计算机技术发布时间: 2023-11-18 17:15:30 浏览:15843 次

zhanlzx:
讲的挺好的，就是声音听着好难受，我的问题 [笑哭]

【回复】我也觉得难受，感觉好想锤这个老师
好好活到毕业:
废话太多了，我开3倍速还觉得没啥信息量

黑芝麻糊不好吃:
代码：https://github.com/BlackMirean/PPO，照着视频抄的[脱单doge]

已是fw求自律:
我想知道ppo算法的AC框架的c网络有啥用[doge]他的奖励值都算好了已经

【回复】回复 @岁月难得一趟 :已经会了在研究多智能体了，参数真的难调
【回复】求平均啊，你在无穷的概率里想求一个平均，只能用神经网络来估计一个平均值
【回复】回复 @Eiee_ : 哈哈哈，me too
大数据狂人:
白嫖课程资料+60G入门到进阶AI资源包+论文指导+kaggle组队+就业指导+技术问题答疑[给心心]

【回复】这个是完整的视频嘛，还有后续这个老师的视频嘛
【回复】关注vx公众：咕泡AI，回复211 获qu[热词系列_干杯]

人工智能程序员神经网络考研最后冲刺 PPO算法机器学习计算机视觉深度学习强化学习计算机专业

如果觉得我的文章对您有用，请随意打赏。您的支持将鼓励我继续创作！