Unsupervised learning: aprendizaje automático sin restricciones
La inteligencia artificial es, actualmente, el tema de mayor relevancia en el ámbito de las ciencias de la computación. Los programas están aprendiendo a imitar la forma de pensar y actuar de las personas y, tras una fase de entrenamiento, pueden llegar a tomar decisiones por sí mismos. La inteligencia artificial incluye el área del aprendizaje automático, que engloba los procedimientos necesarios para que los programas y, por lo tanto, las máquinas puedan aprender de forma independiente. Uno de estos métodos es el aprendizaje no supervisado.
¿En qué consiste el unsupervised learning?
El aprendizaje no supervisado (en inglés, unsupervised learning o unsupervised machine learning) es un método de análisis de datos que pertenece al campo de la inteligencia artificial. Se trata de una red neuronal artificial que se basa en las similitudes que presentan los diferentes valores introducidos. Cuando un ordenador realiza un aprendizaje no supervisado, intenta reconocer de forma autónoma los patrones y estructuras que comparten dichos valores.
Por tanto, el aprendizaje no supervisado sería lo contrario del aprendizaje supervisado, un procedimiento en el que los desarrolladores están totalmente al mando y marcan el objetivo de aprendizaje. Aparte de estos métodos, hay un tercero: el aprendizaje por refuerzo, mediante el cual los desarrolladores solo ofrecen input para influir en el entrenamiento de los algoritmos.
¿Cómo funciona el aprendizaje no supervisado?
Explicado de forma sencilla, este método de aprendizaje consiste en una red neuronal artificial que analiza y utiliza una enorme cantidad de información para determinar contextos, patrones y similitudes entre los datos. Este proceso se basa en diferentes procedimientos. Una de las técnicas que se emplean en esta forma de aprendizaje es el análisis de grupos o clustering. En este caso, los algoritmos se encargan de formar grupos de manera autónoma para, finalmente, asignarlos a los datos.
Por ejemplo, si los datos son fotos de perros y gatos, en el aprendizaje no supervisado, el programa ordena todas las fotos de perros en una categoría y las de gatos, en otra. Sin embargo, esta clasificación no viene dada de antemano, a diferencia del aprendizaje supervisado. En el unsupervised learning, los algoritmos toman estas decisiones de manera independiente, en función de las similitudes y diferencias entre las fotos.
Otro método es la asociación: en este caso, para ordenar los datos, el sistema los combina basándose en los atributos que comparten. De esta manera, la tarea de los algoritmos es encontrar las relaciones que hay entre los objetos, sin necesidad de que exista un parecido entre ellos. Una vez más, podemos tomar el ejemplo de las fotos de perros: mediante la asociación, el algoritmo del aprendizaje no supervisado no agruparía todos los perros juntos, sino que, por ejemplo, relacionaría las correas con los perros.
¿Dónde y cuándo se utiliza el aprendizaje no supervisado?
Hay muchos ejemplos de aprendizaje no supervisado. Gracias a este método de aprendizaje, los programas son capaces de aprender las reglas de un juego y diseñar estrategias ganadoras, por lo que pueden utilizarse en el mercado de valores para conseguir beneficios. De este modo, es posible ofrecerle a un programa datos sin procesar sobre las cotizaciones bursátiles para que, por sí mismo, pueda reconocer las actividades de la bolsa y anticipar tendencias.
La inteligencia artificial y, en particular, el aprendizaje no supervisado, ya se utilizan en muchas otras áreas. Por ejemplo, en el marketing es posible determinar los públicos objetivo más relevantes mediante el método del clustering. En este ámbito, la atención se centra en los grupos de personas, que forman la base para desarrollar las estrategias publicitarias. Los algoritmos pueden aprender de forma independiente a agrupar personas con los procedimientos del unsupervised learning.
Un área en la que ya se ha consolidado firmemente el principio del aprendizaje no supervisado es el reconocimiento de voz, imprescindible para el funcionamiento de asistentes de voz como Siri, Alexa o Google Assistant. Estos programas aprenden los hábitos de habla del propietario y, con el tiempo, pueden entender expresiones cada vez más precisas, aunque la persona hable un dialecto o tenga un impedimento del habla.
También muchos smartphones incorporan el unsupervised learning y permiten así ordenar la galería de imágenes. El aprendizaje independiente y sin supervisión permite que el dispositivo reconozca a una misma persona en varias fotos o identifique mediante los metadatos que dos instantáneas han sido tomadas en la misma ubicación. Gracias a este sistema, podemos ordenar las fotos según el lugar donde se tomaron o las personas retratadas en ellas.
En los chats también se ha probado la eficacia del aprendizaje no supervisado. La mayoría de los usuarios de Internet ya se ha topado con algún programa chatbot, que se encarga de regular la interacción social en las conversaciones virtuales: así, cuando los bots detectan automáticamente insultos, incitación al odio, discriminación o insultos raciales, eliminan a dicho usuario del chat o le llaman la atención. Aquí la inteligencia artificial también desempeña un papel importante. Los chats automatizados que ofrecen servicio al cliente durante los pedidos en línea funcionan de forma similar: ya sea por mensajería o por teléfono, los bots aprenden de forma autónoma y, en parte, sin supervisión.
Ejemplo negativo: chatbot en redes sociales
En 2016, Microsoft se dio cuenta de que el aprendizaje sin supervisión también podía tener un efecto negativo. La empresa creo una cuenta de Twitter para su bot Tay, con inteligencia artificial, que aprendía comunicándose con otros usuarios de la plataforma. Aunque al principio el programa era bastante sencillo, pronto comenzó a utilizar emoticonos e, incluso, a construir frases complejas. Sin embargo, la inteligencia artificial no calibraba el contenido de sus mensajes y rápidamente comenzó a incitar al antifeminismo y a la xenofobia, difundiendo además teorías conspirativas. Todo sucedió en menos de 24 horas. El programa en sí mismo no tenía motivaciones racistas o políticas, sino que simplemente aprendió de las publicaciones de las personas. Se desconoce el número de usuarios de Twitter, si es que lo había, que se permitieron alimentar a Tay con este tipo de datos solo por hacer la gracia.
Ejemplo positivo: investigación genética
Es indudable el efecto positivo del aprendizaje no supervisado en la investigación genética: en este ámbito, el método del clustering sirve de ayuda para analizar el material genético. Los sectores médico y técnico evolucionan con fuerza y al unísono gracias a la inteligencia artificial y sus métodos de aprendizaje, y la investigación se acelera enormemente, lo que permitirá que enfermedades hereditarias como la anemia falciforme o la ceguera de origen genético puedan ser tratadas y curadas en el futuro.
Ventajas del unsupervised machine learning en comparación con otros métodos
El aprendizaje automático no solo se aplica al desarrollo tecnológico, sino que también contribuye a aliviar y facilitar muchas áreas de nuestra rutina diaria, enriqueciendo la vida cotidiana, la economía y la investigación. A diferencia de los otros dos métodos de aprendizaje (supervisado y por refuerzo), los desarrolladores no están involucrados en el propio entrenamiento, lo que, además de un posible ahorro de tiempo, supone otra ventaja: el aprendizaje no supervisado permite reconocer patrones que nadie ha sido capaz de percibir previamente. Así, basándose en el aprendizaje automático no supervisado, los algoritmos también tienen la posibilidad de desarrollar ideas creativas.