响木SVIP目录
响木最新
响木众筹
响木众筹
当前目录
全盘
查全部
文件夹
文件
主页
/
我的资源
/
01 响木最新众筹课
/
1000-1999
/
1700-1799
/
1761.深度之眼
/
01多模态-baseline
/
10-01DQN-07-论文模型.mp4
100-07DDPG-01-开场白.mp4
101-07DDPG-02-研究背景成果和意义.mp4
102-07DDPG-03-背景知识补充.mp4
103-07DDPG-04-论文泛读.mp4
104-07DDPG-05-本节回顾下节预告.mp4
105-07DDPG-06-论文精读结构.mp4
106-07DDPG-07-从DQN到DDPG.mp4
107-07DDPG-08-网络结构.mp4
108-07DDPG-09-DDPG核心思想.mp4
109-07DDPG-10-算法的其他细节.mp4
11-01DQN-08-论文细节一图像预处理.mp4
110-07DDPG-11-算法总结.mp4
111-07DDPG-12-代码部分结构.mp4
112-07DDPG-13-网络结构及初始化.mp4
113-07DDPG-14-BatchNorm的使用.mp4
114-07DDPG-15-参数更新.mp4
115-07DDPG-16-代码结构.mp4
116-07DDPG-17-运行结果.mp4
117-08TD3-01-论文泛读开场白.mp4
118-08TD3-02-研究背景.mp4
119-08TD3-03-背景知识.mp4
12-01DQN-09-论文细节二ReplayBuffer.mp4
120-08TD3-04-论文泛读.mp4
121-08TD3-05-论文泛读总结.mp4
122-08TD3-06-论文精读开场白.mp4
123-08TD3-07-overestimation.mp4
124-08TD3-08-variance.mp4
125-08TD3-09-实验结果.mp4
126-08TD3-10-论文总结.mp4
127-08TD3-11-代码部分结构.mp4
128-08TD3-12-更新Critic.mp4
129-08TD3-13-更新Actor和代码结构.mp4
13-01DQN-10-论文细节三SemiGradientMethod.mp4
130-08TD3-14-实验结果.mp4
131-09SQL-01-论文泛读开场白.mp4
132-09SQL-02-研究背景及成果.mp4
133-09SQL-03-背景知识补充.mp4
134-09SQL-04-论文泛读总结.mp4
135-09SQL-05-论文精读开场白.mp4
136-09SQL-06-核心思想.mp4
137-09SQL-07-理论基础.mp4
138-09SQL-08-算法细节.mp4
139-09SQL-09-实验结果分析.mp4
14-01DQN-11-实验结果分析.mp4
140-09SQL-10-理论证明.mp4
141-09SQL-11-论文精读总结.mp4
142-09SQL-12-代码部分结构.mp4
143-09SQL-13-Pytorch的手动链式法则求导.mp4
144-09SQL-14-离散情况细节.mp4
145-09SQL-15-连续情况细节.mp4
146-09SQL-16-代码结构.mp4
147-09SQL-17-调参结果.mp4
148-10SAC-01-论文泛读开场白.mp4
149-10SAC-02-研究背景.mp4
15-01DQN-12-论文精读总结.mp4
150-10SAC-03-论文泛读.mp4
151-10SAC-04-论文泛读总结.mp4
152-10SAC-05-论文精读开场白.mp4
153-10SAC-06-核心思想.mp4
154-10SAC-07-主要算法.mp4
155-10SAC-08实验结果.mp4
156-10SAC-09-理论证明.mp4
157-10SAC-10-论文精读总结.mp4
158-10SAC-11-算法细节.mp4
159-10SAC-12-代码结构及调参结果.mp4
16-01DQN-13-代码课整体介绍.mp4
160-11AdvancedValueMethods-01-论文泛读开场白.mp4
161-11AdvancedValueMethods-02-背景知识补充.mp4
162-11AdvancedValueMethods-03-Rainbow泛读.mp4
163-11AdvancedValueMethods-04-D4PG泛读.mp4
164-11AdvancedValueMethods-05-A3C泛读.mp4
165-11AdvancedValueMethods-06-IMPALA泛读.mp4
166-11AdvancedValueMethods-07-论文泛读总结.mp4
167-11AdvancedValueMethods-08-论文精读开场白.mp4
168-11AdvancedValueMethods-09-Rainbow.mp4
169-11AdvancedValueMethods-10-D4PG.mp4
17-01DQN-14-gym介绍.mp4
170-11AdvancedValueMethods-11-A3C.mp4
171-11AdvancedValueMethods-12-IMPALA.mp4
172-11AdvancedValueMethods-13-总结.mp4
173-12IntrinsicMotivation-01-论文泛读开场白.mp4
174-12IntrinsicMotivation-02-ICM泛读.mp4
175-12IntrinsicMotivation-03-CuriosityStudy泛读.mp4
176-12IntrinsicMotivation-04-VIME泛读.mp4
177-12IntrinsicMotivation-05-VIC泛读.mp4
178-12IntrinsicMotivation-06-DIAYN泛读.mp4
179-12IntrinsicMotivation-07-SMM泛读.mp4
18-01DQN-15-图像预处理代码.mp4
180-12IntrinsicMotivation-08-EDL泛读.mp4
181-12IntrinsicMotivation-09-泛读总结及下节预告.mp4
182-12IntrinsicMotivation-10-论文精读开场白.mp4
183-12IntrinsicMotivation-11-ICM精读.mp4
184-12-IntrinsicMotivation-12-CuriosityStudy精读.mp4
185-12IntrinsicMotivation-13-VIME精读.mp4
186-12IntrinsicMotivation-14-VIC精读.mp4
187-12IntrinsicMotivation-15-DIAYN精读.mp4
188-12IntrinsicMotivation-16-SMM精读.mp4
189-12IntrinsicMotivation-17-EDL精读.mp4
19-01DQN-16-DQN核心功能实现.mp4
190-12IntrinsicMotivation-18-论文总结.mp4
191-12IntrinsicMotivation-19-结尾语.mp4
20-01DQN-17-代码结构及实验结果分析.mp4
21-02DQN改进-01-论文泛读开场白.mp4
22-02DQN改进-02-研究背景及意义.mp4
23-02DQN改进-03-论文泛读.mp4
24-02DQN改进-04-论文泛读总结及下节预告.mp4
25-02DQN改进-05-论文网络结构.mp4
26-02DQN改进-06-DDQN图表分析.mp4
27-02DQN改进-07-DDQN总结.mp4
28-02DQN改进-08-PER01.mp4
29-02DQN改进-09-PER02.mp4
3-强化学习开营直播.mp4
30-02DQN改进-10-PER实验结果及DuelDQN.mp4
31-02DQN改进-11-下节预告.mp4
32-02DQN改进-12-代码课整体介绍.mp4
33-02DQN改进-13-bisect包.mp4
34-02DQN改进-14-SumTree.mp4
35-02DQN改进-15-SumTree后续及DuelStructure.mp4
36-02DQN改进-16-ReplayBuffer01.mp4
37-02DQN改进-17-ReplayBuffer02.mp4
38-02DQN改进-18-ReplayBuffer03.mp4
39-02DQN改进-19-代码总览及实验结果.mp4
4-01DQN-01-论文泛读开场白.mp4
40-03C51-01-研究成果及意义.mp4
41-03C51-02-背景知识补充01.mp4
42-03C51-03-背景知识补充02.mp4
43-03C51-04-论文泛读.mp4
44-03C51-05-分布更新BellmanEquationBellmanOperator.mp4
45-03C51-06-BellmanOptimalOperator.mp4
46-03C51-07-算法分析.mp4
47-03C51-08-实验结果及分析.mp4
48-03C51-09-引理2引理3证明.mp4
49-03C51-10-引理1证明.mp4
5-01DQN-02-研究背景及意义.mp4
50-03C51-11-定理1证明.mp4
51-03C51-12-其余理论部分及总结.mp4
52-03C51-13-代码部分介绍.mp4
53-03C51-14-算法部分结构一览.mp4
54-03C51-15-分布更新单个样本.mp4
55-03C51-16-MiniBatch分布更新.mp4
56-03C51-17-PytorchMiniBatch分布更新..mp4
57-03C51-18-实验结果.mp4
58-04QRDQN-01-研究背景、意义及补充知识介绍.mp4
59-04QRDQN-02-论文泛读、摘要、框架讲解.mp4
6-01DQN-03-背景知识补充.mp4
60-04QRDQN-03-回顾C51.mp4
61-04QRDQN-04-新的分布更新思路、估计分位数.mp4
62-04QRDQN-05-QRDQN算法讲解、实验结果与分析.mp4
63-04QRDQN-06-理论证明1.mp4
64-04QRDQN-07-理论证明2.mp4
65-04QRDQN-08-上节回顾和下节预告.mp4
66-04QRDQN-09-code1.mp4
67-04QRDQN-10-code2.mp4
68-04QRDQN-11-code3.mp4
69-05REINFORCE-01-开场白及研究背景介绍.mp4
7-01DQN-04-论文泛读.mp4
70-05REINFORCE-02-论文泛读.mp4
71-05REINFORCE-03-背景知识补充.mp4
72-05REINFORCE-04-下节预告.mp4
73-05REINFORCE-05-论文定理理解.mp4
74-05REINFORCE-06-算法核心思想.mp4
75-05REINFORCE-07-核心定理证明.mp4
76-05REINFORCE-08-下节预告.mp4
77-05REINFORCE-09-代码部分结构.mp4
78-05REINFORCE-10-网络结构设计.mp4
79-05REINFORCE-11-数据处理.mp4
8-01DQN-05-泛读总结及下节预告.mp4
80-05REINFORCE-12-主体循环.mp4
81-05REINFORCE-13-代码结构.mp4
82-05REINFORCE-14-运行结果分析.mp4
83-06PPO-01-开场白.mp4
84-06PPO-02-研究背景.mp4
85-06PPO-03-论文泛读.mp4
86-06PPO-04-本节回顾下节预告.mp4
87-06PPO-05-论文精读结构介绍.mp4
88-06PPO-06-ClippedSurrogateLoss.mp4
89-06PPO-07-AdaptiveKL.mp4
9-01DQN-06-论文精读开场白.mp4
90-06PPO-08-AdvantageFunction.mp4
91-06PPO-09-算法分析.mp4
92-06PPO-10-实验结果分析.mp4
93-06PPO-11-本届回顾下节预告.mp4
94-06PPO-12-代码部分结构.mp4
95-06PPO-13-计算LossFunction.mp4
96-06PPO-14-拓展到连续型action空间.mp4
97-06PPO-15-代码结构.mp4
98-06PPO-16-代码运行结果.mp4
99-06PPO-17-算法之外的技巧.mp4
Copyright © All rights reserved.
信息加载中,请等待...