El machine learning -o aprendizaje automático- es una rama de la inteligencia artificial que se puede definir como la capacidad de un programa de reconocer patrones en grandes volúmenes de datos con los que poder realizar predicciones.
Cada uno de los tipos de aprendizaje dispone de una serie de aplicaciones y algoritmos específicos, adaptándose a necesidades distintas o conjuntos de datos en el campo de la IA.
Veamos cuáles son las principales características de los tipos de machine learning: el aprendizaje supervisado, el aprendizaje no supervisado, el aprendizaje semi-supervisado y el aprendizaje por refuerzo.
Aprendizaje supervisado
Como nos explican desde el blog de Telefónica Tech, el aprendizaje supervisado es aquel en el que los algoritmos trabajan con datos etiquetados, de forma que se entrenan con un “histórico” de datos de los que aprender para asignar etiquetas a un nuevo valor.
Estos datos etiquetados para entrenar algoritmos sirven para tomar decisiones y hacer predicciones y es especialmente utilizado para evaluar riesgos, reconocer imágenes o detectar fraudes.
El aprendizaje supervisado utiliza varios algoritmos, siendo algunos de los más destacados los siguientes:
- Árboles de decisión para producir diagramas de construcción lógica y resolver problemas gracias a estas predicciones.
- Naïve Bayes para calcular la probabilidad de que ocurra un evento A si ha sucedido un evento B, con especial incidencia en la industria.
- Regresión logística para predecir conclusiones de una variable categórica según variables dependientes e independientes, con uso en ciencias sociales y sanitarias.
- Conjunto de clasificadores que diseñan un conjunto de estos para catalogar y ponderar los datos que se van tomando.
- Support Vector Machines (SVM) para solventar problemas de clasificación y regresión, a través de la creación de un hiperplano en el que la distancia entre dos puntos sea la máxima.
Aprendizaje no supervisado
Por su parte, en aprendizaje no supervisado, a diferencia del supervisado -como hemos analizado anteriormente- carece de datos “etiquetados” para el entrenamiento.
Al tratar de describir la estructura de los datos, este tipo de aprendizaje tiene un carácter exploratorio, permitiendo el reconocimiento de patrones y el modelo predictivo.
Este tipo de aprendizaje resulta de utilidad al trabajar con datos complejos y no estructurados al hacer posible que se obtengan resultados sin haberse etiquetado manualmente grandes volúmenes de datos.
Entre sus aplicaciones se encuentra la segmentación de clientes, la comprensión de datos, así como análisis exploratorios de los mismos, la recomendación de productos o el reconocimiento de patrones.
Aprendizaje semi-supervisado
Como quizá se pueda deducir por su propio nombre, el aprendizaje semi-supervisado combina los dos modelos que ya hemos analizado anteriormente: el supervisado y el no supervisado.
En este, se etiquetan manualmente algunos de los comentarios y cuando se dispone de un pequeño grupo ya etiquetado, se entrenan uno o varios algoritmos de aprendizaje supervisado sobre esa muestra y los modelos resultantes son utilizados para etiquetar el resto de los comentarios.
Por esta razón, resulta eficaz en los supuestos en los que la recopilación de datos etiquetados pueda ser dificultosa o con un elevado coste.
En resumidas cuentas, en este modelo de machine learning el pequeño volumen de datos etiquetados guían en el proceso de aprendizaje al mayor conjunto de datos que no lo están.
Así pues, se combinan el aprendizaje no supervisado para identificar grupos de datos para posteriormente etiquetar los grupos gracias al aprendizaje supervisado.
Aprendizaje por refuerzo
En este caso, los algoritmos aprenden por su propia experiencia según ensayo y error, recompensando los primeros y castigando los segundos.
De esta mayor, al contar con mayor práctica, los algoritmos pueden predecir de manera correcta los eventos en estudio.
Basado en la psicología conductista o behaviorista, parte de la interacción del agente con el entorno aprendiendo de situaciones o acciones del pasado sin que sea necesario disponer de resultados conocidos o previos, a excepción del objetivo final del problema.