深度强化学习(1/5):基本概念 Deep Reinforcement Learning (1/5)

我将用5节课的时间讲解深度强化学习。这节课的内容是强化学习中的基本概念:Agent (智能体)、Environment (环境)、State (状态)、Action (动作)、Reward (奖励)、Policy (策略)、State Transition (状态转移)、Return (回报)、Value Functions (价值函数)。 这节课的主要内容: 0:30 概率论基础知识 6:56 强化学习基本术语 12:54 Agent (智能体) 与 Environment (环境) 的交互 13:39 强化学习中的随机性 16:18 Reward (奖励) 与 Return (回报) 20:31 Value functions (价值函数) 27:51 用强化学习打游戏,以及OpenAI Gym的使用 34:53 总结这节课的内容 强化学习基础: 1. 基本概念:   • 深度强化学习(1/5):基本概念  Deep Reinforcement Learn...   2. 价值学习:   • 深度强化学习(2/5):价值学习  Value-Based Reinforcemen...   3. 策略学习:   • 深度强化学习(3/5):策略学习  Policy-Based Reinforceme...   4. Actor-Critic:   • 深度强化学习(4/5):Actor-Critic Methods   5. AlphaGo:   • 深度强化学习(5/5):AlphaGo & Model-Based RL   课件:https://github.com/wangshusen/DRL

深度强化学习(2/5):价值学习  Value-Based Reinforcement Learning
▶︎

深度强化学习(2/5):价值学习 Value-Based Reinforcement Learning

深度强化学习(3/5):策略学习  Policy-Based Reinforcement Learning
▶︎

深度强化学习(3/5):策略学习 Policy-Based Reinforcement Learning

How Modern AI Actually Learns
▶︎

How Modern AI Actually Learns

[Full Workshop] Reinforcement Learning, Kernels, Reasoning, Quantization & Agents — Daniel Han
▶︎

[Full Workshop] Reinforcement Learning, Kernels, Reasoning, Quantization & Agents — Daniel Han

【漫士科普】90分钟深度!一口气看明白人工智能和神经网络#人工智能 #神经网络
▶︎

【漫士科普】90分钟深度!一口气看明白人工智能和神经网络#人工智能 #神经网络

【機器學習 Machine Learning】3小時初學者教學 | 人工智慧 AI | Python | 機器學習入門 | 機器學習教學 #AI #ML #深度學習
▶︎

【機器學習 Machine Learning】3小時初學者教學 | 人工智慧 AI | Python | 機器學習入門 | 機器學習教學 #AI #ML #深度學習

給非專業人士製作的 AI概念解析 | 從零入門,講講人與AI的故事
▶︎

給非專業人士製作的 AI概念解析 | 從零入門,講講人與AI的故事

The FASTEST introduction to Reinforcement Learning on the internet
▶︎

The FASTEST introduction to Reinforcement Learning on the internet

Don't learn AI Agents without Learning these Fundamentals
▶︎

Don't learn AI Agents without Learning these Fundamentals

15分鐘學會AI Agent|完整講解
▶︎

15分鐘學會AI Agent|完整講解

【機器學習2021】概述增強式學習 (Reinforcement Learning, RL) (一) – 增強式學習跟機器學習一樣都是三個步驟
▶︎

【機器學習2021】概述增強式學習 (Reinforcement Learning, RL) (一) – 增強式學習跟機器學習一樣都是三個步驟

Listen and Feel the Peace | Tibetan Healing Sounds for Deep Meditation, Inner Peace & Soul Healing
▶︎

Listen and Feel the Peace | Tibetan Healing Sounds for Deep Meditation, Inner Peace & Soul Healing

从编解码和词嵌入开始,一步一步理解Transformer,注意力机制(Attention)的本质是卷积神经网络(CNN)
▶︎

从编解码和词嵌入开始,一步一步理解Transformer,注意力机制(Attention)的本质是卷积神经网络(CNN)

深度强化学习(4/5):Actor-Critic Methods
▶︎

深度强化学习(4/5):Actor-Critic Methods

Reinforcement Learning: Machine Learning Meets Control Theory
▶︎

Reinforcement Learning: Machine Learning Meets Control Theory

MIT 6.S191 (2025): Reinforcement Learning
▶︎

MIT 6.S191 (2025): Reinforcement Learning

ML Lecture 23-1: Deep Reinforcement Learning
▶︎

ML Lecture 23-1: Deep Reinforcement Learning

一口气搞懂「强化学习」| Reinforcement Learning
▶︎

一口气搞懂「强化学习」| Reinforcement Learning

RL for Agents Workshop - Deep Dive on Training Agents with RL and Open Source
▶︎

RL for Agents Workshop - Deep Dive on Training Agents with RL and Open Source