Q-learning
El aprendizaje Q es un algoritmo de aprendizaje automático utilizado para resolver problemas de aprendizaje por refuerzo. El algoritmo está diseñado para encontrar la política óptima para un proceso de decisión de Markov (MDP) dado. El algoritmo de aprendizaje Q se basa en el concepto de aprendizaje del valor de un par estado-acción, conocido como … Leer más