深度强化学习(1/5)：基本概念 Deep Reinforcement Learning (1/5)

我将用5节课的时间讲解深度强化学习。这节课的内容是强化学习中的基本概念：Agent (智能体)、Environment (环境)、State (状态)、Action (动作)、Reward (奖励)、Policy (策略)、State Transition (状态转移)、Return (回报)、Value Functions (价值函数)。这节课的主要内容： 0:30 概率论基础知识 6:56 强化学习基本术语 12:54 Agent (智能体) 与 Environment (环境) 的交互 13:39 强化学习中的随机性 16:18 Reward (奖励) 与 Return (回报) 20:31 Value functions (价值函数) 27:51 用强化学习打游戏，以及OpenAI Gym的使用 34:53 总结这节课的内容强化学习基础： 1. 基本概念： • 深度强化学习(1/5)：基本概念 Deep Reinforcement Learn... 2. 价值学习： • 深度强化学习(2/5)：价值学习 Value-Based Reinforcemen... 3. 策略学习： • 深度强化学习(3/5)：策略学习 Policy-Based Reinforceme... 4. Actor-Critic： • 深度强化学习(4/5)：Actor-Critic Methods 5. AlphaGo： • 深度强化学习(5/5)：AlphaGo & Model-Based RL 课件：https://github.com/wangshusen/DRL

深度强化学习(2/5)：价值学习 Value-Based Reinforcement Learning

深度强化学习(2/5)：价值学习 Value-Based Reinforcement Learning

深度强化学习(3/5)：策略学习 Policy-Based Reinforcement Learning

深度强化学习(3/5)：策略学习 Policy-Based Reinforcement Learning

How Modern AI Actually Learns

How Modern AI Actually Learns

[Full Workshop] Reinforcement Learning, Kernels, Reasoning, Quantization & Agents — Daniel Han

[Full Workshop] Reinforcement Learning, Kernels, Reasoning, Quantization & Agents — Daniel Han

【漫士科普】90分钟深度！一口气看明白人工智能和神经网络#人工智能 #神经网络

【漫士科普】90分钟深度！一口气看明白人工智能和神经网络#人工智能 #神经网络

【機器學習 Machine Learning】3小時初學者教學 | 人工智慧 AI | Python | 機器學習入門 | 機器學習教學 #AI #ML #深度學習

【機器學習 Machine Learning】3小時初學者教學 | 人工智慧 AI | Python | 機器學習入門 | 機器學習教學 #AI #ML #深度學習

給非專業人士製作的 AI概念解析 | 從零入門，講講人與AI的故事

給非專業人士製作的 AI概念解析 | 從零入門，講講人與AI的故事

The FASTEST introduction to Reinforcement Learning on the internet

The FASTEST introduction to Reinforcement Learning on the internet

Don't learn AI Agents without Learning these Fundamentals

Don't learn AI Agents without Learning these Fundamentals

15分鐘學會AI Agent｜完整講解

15分鐘學會AI Agent｜完整講解

【機器學習2021】概述增強式學習 (Reinforcement Learning, RL) (一) – 增強式學習跟機器學習一樣都是三個步驟

【機器學習2021】概述增強式學習 (Reinforcement Learning, RL) (一) – 增強式學習跟機器學習一樣都是三個步驟

Listen and Feel the Peace | Tibetan Healing Sounds for Deep Meditation, Inner Peace & Soul Healing

Listen and Feel the Peace | Tibetan Healing Sounds for Deep Meditation, Inner Peace & Soul Healing

从编解码和词嵌入开始，一步一步理解Transformer，注意力机制(Attention)的本质是卷积神经网络(CNN)

从编解码和词嵌入开始，一步一步理解Transformer，注意力机制(Attention)的本质是卷积神经网络(CNN)

深度强化学习(4/5)：Actor-Critic Methods

深度强化学习(4/5)：Actor-Critic Methods

Reinforcement Learning: Machine Learning Meets Control Theory

Reinforcement Learning: Machine Learning Meets Control Theory

MIT 6.S191 (2025): Reinforcement Learning

MIT 6.S191 (2025): Reinforcement Learning

ML Lecture 23-1: Deep Reinforcement Learning

ML Lecture 23-1: Deep Reinforcement Learning

一口气搞懂「强化学习」| Reinforcement Learning

一口气搞懂「强化学习」| Reinforcement Learning

RL for Agents Workshop - Deep Dive on Training Agents with RL and Open Source

RL for Agents Workshop - Deep Dive on Training Agents with RL and Open Source