Nº 170: IA Grafos - Aprendizaje por Refuerzo 02 (Pasivo)

Donaciones: https://www.paypal.me/jliglesiasferia Explicación del aprendizaje por refuerzo pasivo, donde la política está fijada y no se podrá cambiar. Se aprenden los valores de los estados mediante observaciones. Se explicarán 2 técnicas: la evaluación directa y la diferencia temporal. Una ampliación de esta última es la que dará lugar al algoritmo Q-Learning que veremos en el próximo vídeo. PDF con las Diapositivas de la Presentación: https://www.dropbox.com/s/hhm399kb9wn... Libros Recomendados: · "IA: Un Enfoque Moderno" https://amzn.to/2VCZn20 · "IA: Funcamentos, Práctica y Aplicaciones" https://amzn.to/2OGhum3 · "IA Avanzada" https://amzn.to/3133xkI · "Probabilidad y Estadística" https://amzn.to/2VzeDwL · "Aprendizaje Automático" https://amzn.to/2ILC1ll · "Lógica para Principiantes" https://amzn.to/35sfJin Licencia CC-BY-NC Creative Commons - Reconocimiento - No Comercial