深度强化学习(1/5):基本概念 Deep Reinforcement Learning (1/5)
我将用5节课的时间讲解深度强化学习。这节课的内容是强化学习中的基本概念:Agent (智能体)、Environment (环境)、State (状态)、Action (动作)、Reward (奖励)、Policy (策略)、State Transition (状态转移)、Return (回报)、Value Functions (价值函数)。 这节课的主要内容: 0:30 概率论基础知识 6:56 强化学习基本术语 12:54 Agent (智能体) 与 Environment (环境) 的交互 13:39 强化学习中的随机性 16:18 Reward (奖励) 与 Return (回报) 20:31 Value functions (价值函数) 27:51 用强化学习打游戏,以及OpenAI Gym的使用 34:53 总结这节课的内容 强化学习基础: 1. 基本概念: • 深度强化学习(1/5):基本概念 Deep Reinforcement Learn... 2. 价值学习: • 深度强化学习(2/5):价值学习 Value-Based Reinforcemen... 3. 策略学习: • 深度强化学习(3/5):策略学习 Policy-Based Reinforceme... 4. Actor-Critic: • 深度强化学习(4/5):Actor-Critic Methods 5. AlphaGo: • 深度强化学习(5/5):AlphaGo & Model-Based RL 课件:https://github.com/wangshusen/DRL

▶︎
深度强化学习(2/5):价值学习 Value-Based Reinforcement Learning

▶︎
深度强化学习(3/5):策略学习 Policy-Based Reinforcement Learning

▶︎
How Modern AI Actually Learns
![[Full Workshop] Reinforcement Learning, Kernels, Reasoning, Quantization & Agents — Daniel Han](https://i.ytimg.com/vi/OkEGJ5G3foU/hqdefault.jpg?sqp=-oaymwEjCNACELwBSFryq4qpAxUIARUAAAAAGAElAADIQj0AgKJDeAE=&rs=AOn4CLDALOTyyIB7iZX9LiUj82NSPuT6Hw)
▶︎
[Full Workshop] Reinforcement Learning, Kernels, Reasoning, Quantization & Agents — Daniel Han

▶︎
【漫士科普】90分钟深度!一口气看明白人工智能和神经网络#人工智能 #神经网络

▶︎
【機器學習 Machine Learning】3小時初學者教學 | 人工智慧 AI | Python | 機器學習入門 | 機器學習教學 #AI #ML #深度學習

▶︎
給非專業人士製作的 AI概念解析 | 從零入門,講講人與AI的故事

▶︎
The FASTEST introduction to Reinforcement Learning on the internet

▶︎
Don't learn AI Agents without Learning these Fundamentals

▶︎
15分鐘學會AI Agent|完整講解

▶︎
【機器學習2021】概述增強式學習 (Reinforcement Learning, RL) (一) – 增強式學習跟機器學習一樣都是三個步驟

▶︎
Listen and Feel the Peace | Tibetan Healing Sounds for Deep Meditation, Inner Peace & Soul Healing

▶︎
从编解码和词嵌入开始,一步一步理解Transformer,注意力机制(Attention)的本质是卷积神经网络(CNN)

▶︎
深度强化学习(4/5):Actor-Critic Methods

▶︎
Reinforcement Learning: Machine Learning Meets Control Theory

▶︎
MIT 6.S191 (2025): Reinforcement Learning

▶︎
ML Lecture 23-1: Deep Reinforcement Learning

▶︎
一口气搞懂「强化学习」| Reinforcement Learning

▶︎
