En este tema se aprenderá sobre un tipo de aprendizaje automático en el que un agente interactúa con un ambiente y recibe retroalimentación en forma de recompensas o castigos según las acciones que realiza. Se estudiarán algoritmos como Q-learning, SARSA, entre otros, y se analizarán casos de estudio y aplicaciones prácticas en diversos campos.