AI Reinforcement Learning - eLearning

450,00 EUR

  • 30 hours
eLearning

Adéntrate en el futuro de la IA con el curso de Aprendizaje por Refuerzo, donde las máquinas aprenden interactuando, adaptándose y mejorando a través de la experiencia. Este curso te introduce en una de las ramas más poderosas del aprendizaje automático, utilizada en robótica, IA para videojuegos, sistemas de recomendación y toma de decisiones autónoma.

Características clave

Idioma

Curso y material en inglés

Nivel

Nivel principiante - avanzado

Acceso

1 año de acceso a la plataforma de aprendizaje

9 horas de videos a demanda

con más de 30 horas de estudio recomendadas

30 ejercicios guiados y prácticos

8 evaluaciones calificadas automáticamente

46 cuestionarios de repaso

2 tareas integrales

Certificado

Certificación de finalización del programa incluida

Resultados de aprendizaje

Al final de este curso, podrás comprender:

Fundamentos

Domina los fundamentos del aprendizaje por refuerzo multiagente (RL)

Paradigmas fundamentales

Explora los tres paradigmas fundamentales del aprendizaje automático

Saldo

Comprender el equilibrio entre exploración y explotación

Tabular-Q

Aprende los enfoques de Q-learning tabular y Deep Q-learning

RLib

Entrenar múltiples agentes con RLib

Markov

Adquiere una comprensión de las cadenas de Márkov y los procesos de decisión

Hero

Cronograma del curso

  1. Introducción al aprendizaje por refuerzo 

    Lección 01

    • Tres paradigmas del aprendizaje automático
    • Historias de éxito de RL
    • Elementos de un problema de RL
    • Introducción al gimnasio
    • Entrena tu primer agente de RL con RLlib
  2. RL de un solo paso: bandidos multiarmados

    Lección 02

    • Entorno de bandido multiarmado
    • Equilibrio entre exploración y explotación
    • Enfoques fundamentales para equilibrar exploración y explotación
    • Enfoques avanzados para equilibrar exploración y explotación
    • Introducción a los problemas de bandido contextual
    • Un ejemplo práctico de bandido contextual
    • Bandidos contextuales profundos
    • Exploración con bandits contextuales profundos
    • Un ejemplo práctico con bandits contextuales profundos
  3. Aprendizaje por refuerzo de múltiples pasos

    Lección 03

    • Introducción a las cadenas de Márkov
    • Proceso de recompensa de Markov
    • Proceso de decisión de Markov
    • Evaluación e iteración de políticas
    • Q-Learning tabular
    • Ejemplo práctico de Q-Learning tabular
    • Aprendizaje profundo Q
    • Uso de RLlib para entrenar una red Deep Q
    • Métodos basados en políticas
    • Uso de RLib para entrenar un agente PPO
  4. Enfoques para el aprendizaje por refuerzo en el mundo real

    Lección 04

    • Manejo de recompensas escasas y exploración difícil
    • Implementar modelado de recompensas
    • Desventajas del modelado de recompensas
    • Uso de la memoria para manejar la observabilidad parcial
    • Resolución de Cartpole sin estado usando LSTM
    • Superar la brecha entre simulación y realidad
    • Introducción al aprendizaje por refuerzo multiagente
    • Entrenamiento de múltiples agentes con RLib
    • Aprendizaje por refuerzo multiagente
    • Aprendizaje por refuerzo sin conexión
    • Conclusión y otros temas avanzados
Aprendizaje por refuerzo

¿Quién debería inscribirse en este programa?

Aspirantes a ingenieros de IA y aprendizaje automático

Científicos de datos que buscan expandirse al aprendizaje por refuerzo

Desarrolladores de software interesados en sistemas inteligentes y automatización

Entusiastas de la robótica y el desarrollo de videojuegos

Estudiantes y profesionales que exploran conceptos avanzados de IA

Para cualquiera que sienta curiosidad por cómo la IA aprende mediante prueba y error

Comenzar curso ahora

Requisitos previos

  • Conocimientos básicos de programación en Java Core
  • Familiaridad con los conceptos de programación orientada a objetos (POO)
  • Conocimientos básicos sobre el uso de un IDE (por ejemplo, Eclipse o Spring Tool Suite)
  • Tener un conocimiento general de cómo funcionan las aplicaciones web es útil, pero no obligatorio

Declaraciones

Licencias y acreditación

Este curso se ofrece de acuerdo con el Acuerdo del Programa de Socios y cumple con los requisitos del Acuerdo de Licencia

Política de equidad

Se anima a los candidatos a ponerse en contacto con AVC para recibir orientación y apoyo durante todo el proceso de adaptación.


Preguntas frecuentes

Contact background

¿Necesita soluciones corporativas o integración LMS?

¿No encontraste el curso o programa que encajaría para tu empresa? ¿Necesitas integración con un LMS? ¡Escríbenos! ¡Resolveremos todo!