当前目录
全盘
查全部
文件夹
文件
主页
/
2022年
/
11月
/
007.百战程序员-AI算法工程师就业班2022年价值18980元重磅首发冲击百万年薪完结无秘
/
31--【加课】 强化学习【新增】
/
4--Actor Critic (A3C)
/
1-ActorCritic原理_把PG和QLearning结合起来【萌萌家】.mp4
10-代码实战_A3C_增加actor探索性用到熵_定义worker正太分布抽样和求梯度的逻辑【萌萌家】.mp4
11-代码实战_A3C_定义AC网络结构_定义worker拉取参数和更新全局网络参数的逻辑【萌萌家】.mp4
12-代码实战_A3C_结合流程图分三点总结前面讲的代码【萌萌家】.mp4
13-代码实战_A3C_讲解线程中worker和环境交互【萌萌家】.mp4
14-代码实战_A3C_讲解线程中worker和GlobalNet交互_代码运行效果展示【萌萌家】.mp4
2-AdvantageActorCritic_共享参数和修改reward技巧【萌萌家】.mp4
3-代码实战_ActorCritic与环境交互【萌萌家】.mp4
4-代码实战_Actor网络构建及训练【萌萌家】.mp4
5-代码实战_详解Critic网络构建及训练【萌萌家】.mp4
6-A3C架构和训练流程【萌萌家】.mp4
7-Pendulum环境_根据网络预测的μ和σ得到连续型的action值【萌萌家】.mp4
8-代码实战_A3C_讲解Coordinator调度多线程运算【萌萌家】.mp4
9-代码实战_A3C_定义Worker计算loss的逻辑_针对连续型的action提高actor探索性【萌萌家】.mp4
Copyright © All rights reserved.
信息加载中,请等待...