17个店铺,23个品类会员课,已七年累计服务31+万客户!更新更加有保障!+客服V:qiqi11931,沟通更方便,并免费赠送自选课一门!
主页
/
2023年
/
10月
/
07.人工智能深度学习系统班6 期
/
18 强化学习实战系列
/
02 PPO算法与公式推导
/
01 基本情况介绍_ev.mp4
02 与环境交互得到所需数据_ev.mp4
03 要完成的目标分析_ev.mp4
04 策略梯度推导_ev.mp4
05 baseline方法_ev.mp4
06 OnPolicy与OffPolicy策略_ev.mp4
07 importance sampling的作用_ev.mp4
08 PPO算法整体思路解析_ev.mp4
Copyright © All rights reserved.
信息加载中,请等待...