Utiliza el código
BLACKFRIDAY
en la página de pago para acceder a un
descuento del 50%.
La oferta finaliza en:
Auto reproducción
Autocompletar
Clase Anterior
Completar y continuar
Reinforcement Learning - Aprendizaje por Refuerzo con Python
Introducción al curso y al aprendizaje por refuerzo
Presentación del curso (2:23)
Introducción al Reinforcement Learning (16:10)
Instalación y preparación del entorno
¿Qué es un Jupyter Notebook? (1:32)
Entorno offline - Instalación Anaconda y Jupyter Notebooks (4:11)
Entorno online - Google Colab (2:02)
Archivos del curso
Fundamentos y Métodos Iniciales del Aprendizaje por Refuerzo
Conceptos fundamentales del aprendizaje por refuerzo (10:01)
Procesos de decisión de Markov (10:15)
Procesos de decisión de Markov en código (29:47)
Programación dinámica (7:05)
Iteración de valor (19:25)
Métodos de Montecarlo (8:01)
Implementación de epsilon greedy (17:06)
Métodos Temporales y Algoritmos de Aprendizaje en Acción
Métodos de diferencias temporales (9:37)
Implementación de SARSA (13:45)
Implementación de Q Learning (16:49)
Optimización y Manejo de Estados en Aprendizaje por Refuerzo
Tareas clásicas de control de código (14:46)
Agregación de estados I (16:38)
Agregación de estados II (4:15)
Deep Learning y Implementaciones avanzadas
Introducción a las redes neuronales (15:35)
La teoria detrás de Deep Sarsa y Deep Q-Learning (5:59)
Deep SARSA I (13:31)
Deep SARSA II (14:43)
Deep SARSA III (16:38)
Deep QLearning I (5:22)
Deep QLearning II (13:58)
Proyecto Final
Presentación Proyecto Final (1:14)
Solución Proyecto Final (10:50)
Procesos de decisión de Markov en código
Contenido bloqueados
Si ya estás inscrito,
tendrá que iniciar sesion
.
Inscriba en el curso para desbloquear