Nº 170: IA Grafos - Aprendizaje por Refuerzo 02 (Pasivo)
Donaciones: https://www.paypal.me/jliglesiasferia Explicación del aprendizaje por refuerzo pasivo, donde la política está fijada y no se podrá cambiar. Se aprenden los valores de los estados mediante observaciones. Se explicarán 2 técnicas: la evaluación directa y la diferencia temporal. Una ampliación de esta última es la que dará lugar al algoritmo Q-Learning que veremos en el próximo vídeo. PDF con las Diapositivas de la Presentación: https://www.dropbox.com/s/hhm399kb9wn... Libros Recomendados: · "IA: Un Enfoque Moderno" https://amzn.to/2VCZn20 · "IA: Funcamentos, Práctica y Aplicaciones" https://amzn.to/2OGhum3 · "IA Avanzada" https://amzn.to/3133xkI · "Probabilidad y Estadística" https://amzn.to/2VzeDwL · "Aprendizaje Automático" https://amzn.to/2ILC1ll · "Lógica para Principiantes" https://amzn.to/35sfJin Licencia CC-BY-NC Creative Commons - Reconocimiento - No Comercial

Nº 171: IA Grafos - Aprendizaje por Refuerzo 03 (Activo, Q-Learning)

Nº 172: IA Grafos - Aprendizaje por Refuerzo 04 (Activo Aproximado)

No. 179: Logical AI - Version Space 01

Nº 213: Redes Neuronales 22 - Optimización 04

the best classical music for concentration | atmospheric music for focus

Experto en Computación Cuántica: Estamos a Punto de Perder el Control de la IA | Dr. J.I. Latorre

Frankreich – Schweden Highlights | Sechzehntelfinale, FIFA WM 2026 | sportstudio

Una clase magistral del pionero de la inteligencia artificial | Jürgen Schmidhuber

Experto en IA: La Gran Mentira de la Inteligencia Artificial | Dr. Ramón López de Mántaras

Qué es la realidad según la física cuántica | Sonia Fernández-Vidal, física

Nervous System Regulation (999 Hz) | 1 hour handpan music | Malte Marten

Will AI outsmart human intelligence? - with 'Godfather of AI' Geoffrey Hinton

How Imaginary Numbers Were Invented

Lo que ocurre dentro de una IA cuando le preguntas algo

¿Te arrastrará la IA a la trampa del Universo 25?

“I’ve seen how governments suppress freedom” | Telegram founder Pavel Durov at Oslo Freedom Forum

Instant Focus Mode – 40Hz Gamma Brainwave Music for Deep Focus & Productivity

Nº 209: Redes Neuronales 18 - Retropropagación del Error 02

