当前目录
全盘
查全部
文件夹
文件
主页
/
2022年
/
11月
/
007.百战程序员-AI算法工程师就业班2022年价值18980元重磅首发冲击百万年薪完结无秘
/
31--【加课】 强化学习【新增】
/
1--Q-Learning与SARSA算法
/
1-强化学习通过智能体与环境交互进行学习【萌萌家】.mp4
10-代码实战Q-Learning智能体训练模型【萌萌家】.mp4
11-代码实战Sarsa_Agent和Env整体交互【萌萌家】.mp4
12-代码实战Sarsa_Agent选择行为和训练模型【萌萌家】.mp4
13-代码实战SarsaLambda_训练模型【萌萌家】.mp4
2-引入马尔科夫链和价值评估的Q值与V值【萌萌家】.mp4
3-详解Q值和V值以及它们之间关系【萌萌家】.mp4
4-蒙特卡洛采样回溯计算V值【萌萌家】.mp4
5-蒙特卡洛和时序差分估算状态V值【萌萌家】.mp4
6-SARSA算法和Q-learning算法【萌萌家】.mp4
7-理解Q-table_创建maze交互环境【萌萌家】.mp4
8-代码实战Q-Learning_Agent和Env整体交互【萌萌家】.mp4
9-代码实战Q-Learning智能体选择行为【萌萌家】.mp4
Copyright © All rights reserved.
信息加载中,请等待...