1. TIPOS DE MODELOS
Los diferentes algoritmos de Aprendizaje Automático se agrupan en una taxonomía en función de la salida de los mismos. Algunos tipos de algoritmos son:

1.1. Aprendizaje supervisado

El aprendizaje supervisado es una técnica para deducir una función a partir de datos de formación ( la base de conocimiento del sistema está formada por ejemplos de etiquetados anteriores). Los datos de formación consisten de pares de objetos (normalmente vectores): una componente del par son los datos de entrada y el otro, los resultados deseados. La salida de la función puede ser un valor numérico (como en los problemas de regresión) o una etiqueta de clase (como en los de clasificación). El objetivo del aprendizaje supervisado es el de crear una función capaz de predecir el valor correspondiente a cualquier objeto de entrada válida después de haber visto una serie de ejemplos, los datos de formación. Para ello, tiene que generalizar a partir de los datos presentados a las situaciones no vistas previamente.
APRENDIZAJE SUPERVISADO EN MACHINE LEARNING - Todo lo que debes saber
1.2. Aprendizaje no supervisado

El aprendizaje no supervisado es un método de aprendizaje automático (AA) donde un modelo se ajusta a las observaciones. Se distingue del aprendizaje supervisado por el hecho de que no hay un conocimiento a priori. En el aprendizaje no supervisado, un conjunto de datos de objetos de entrada es tratado. Así, el aprendizaje no supervisado típicamente trata los objetos de entrada como un conjunto de variables aleatorias, siendo construido un modelo de densidad para el conjunto de datos.
APRENDIZAJE NO SUPERVISADO EN MACHINE LEARNING - Todo lo que debes saber
1.3. Diferencia entre aprendizaje supervisado y no supervisado
DIFERENCIA ENTRE APRENDIZAJE SUPERVISADO Y NO SUPERVISADO
1.4. Aprendizaje por refuerzo
El algoritmo aprende observando el mundo que le rodea. Su información de entrada es la retroalimentación que obtiene del mundo exterior como respuesta a sus acciones. Por lo tanto, el sistema aprende a base de ensayo-error.
El aprendizaje por refuerzo es el más general entre las tres categorías. En vez de que un instructor indique al agente qué hacer, el agente inteligente debe aprender cómo se comporta el entorno mediante recompensas (refuerzos) o castigos, derivados del éxito o del fracaso respectivamente. El objetivo principal es aprender la función de valor que le ayude al agente inteligente a maximizar la señal de recompensa y así optimizar sus políticas de modo a comprender el comportamiento del entorno y a tomar buenas decisiones para el logro de sus objetivos formales.
Entre las implementaciones desarrolladas está AlphaGo, un programa de IA desarrollado por Google DeepMind para jugar el juego de mesa Go.
Documental AlphaGo (subtítulos en español)