machine learning

¿Qué es Machine Learning y Big Data?

Por Ignacia Córdova

Jorge Luis Borges, publicó en 1942 en el Diario La Nación, un cuento corto llamado “Funes El Memorioso”. Ireneo Funes, hijo de la planchadora del pueblo, es el protagonista de esta historia de fantasía. La historia cuenta que este personaje sufre un accidente a los 19 años que le otorga una extraña habilidad, la de recordar absolutamente todo. «Más recuerdos tengo yo solo que los que habrán tenido todos los hombres desde que el mundo es mundo», es una de las frases más célebres de este autor.

De hecho, el personaje mediante su rara destreza creó un vocabulario infinito para los números naturales donde algunos eran: azufre, los bastos, la ballena, el gas, la caldera, Napoléon o Agustín de Vedía. Su cerebro almacenaba tanta cantidad de información que aprendió fácilmente muchos idiomas y podía describir lo que había hecho un día entero, en un día entero. Difícil es creer que Borges hace 80 años ya empezaba a armar lo que es, hoy en día, el concepto de Big Data

Big Data y sus características

Big Data se refiere a grandes volúmenes de datos que resultan complicados de capturar y procesar mediante los métodos tradicionales. Si bien, existen muchas formas de obtener grandes cantidades de datos, estos poseen las siguientes características:

  • Volumen: Tiene que realizarse el almacenamiento de una masiva cantidad de datos.
  • Velocidad: Los datos son generados en tiempo real y todo el tiempo, por lo que es imperativo que sean procesados con la misma velocidad que con la que se generan.
  • Variedad: Debe existir un pool con todo tipo de datos: estructurados o no estructurados.
  • Veracidad: Las fuentes de los datos deben ser confiables, para garantizar la calidad y confiabilidad de los datos, y evitar la limpieza de estos. 
  • Valor: Los datos deben otorgar un beneficio a la entidad que los desea utilizar. Es decir, no deben ser datos “basura”.

Parte de la definición de Big Data nos cuenta que estos datos, debido a su volumen, son difíciles de procesar con las formas que existían antes. Entonces, ¿Cómo manejamos esta cantidad de datos si ya no nos son de utilidad los métodos tradicionales? Una de las herramientas, perteneciente al área de la inteligencia artificial, que ayuda a esta misión es el Machine Learning. Esta herramienta permite a un sistema aprender de los datos sin la necesidad de escribir un código que le indique cómo realizarlo. En otras palabras, el sistema aprende a procesar los datos solo. La  palabra aprender en este contexto se refiere a identificar patrones complejos en millones de datos o Big Data. Esta técnica se puede utilizar con el fin de revisar los datos ya existentes y predecir comportamientos futuros. 

Cómo funciona el Machine Learning 

Una de las grandes preguntas en esta área es cómo le enseñamos a los sistemas a aprender. En Machine Learning a los datos les llamamos instancias. Estas pueden contener atributos o rasgos significativos con los que las podemos categorizar en clases. Para realizar esto se utilizan etiquetas con el fin de agruparlos o asignarles valores. Luego al sistema se le proporcionan datos de entrenamiento y finalmente, se le hacen pruebas de rendimiento que ayudan a saber que tan eficiente es el algoritmo mediante un porcentaje de error o de acierto.

Uno de los ejemplos más comunes de Machine Learning son los sistemas de recomendación. Con el fin de que las plataformas nos recomienden una nueva canción, un nuevo artista o una película, los algoritmos de aprendizaje automático asocian tus preferencias con otros usuarios que tienen un gusto similar.

Los tipos de Machine Learning

Existen 3 categorías de Machine Learning. La primera, el aprendizaje supervisado, encuentra patrones en datos con el fin de aplicarles un proceso de analítica. Estos datos poseen características etiquetadas que dan al sistema información sobre ellos. Por otro lado, el aprendizaje no supervisado alberga datos sin la necesidad de etiquetarlos y el algoritmo tiene la tarea de clasificar o descifrar la información por sí solo. El tercero, el aprendizaje de refuerzo, sólo necesita indicaciones para aprender a través de prueba y error. Finalmente, existe el deep learning. Si bien no es una categoría, vale la pena mencionarlo ya que es una característica de ciertos métodos para procesar la información. Este incorpora redes neuronales en capas sucesivas o deep layers para aprender de los datos de manera sucesiva e iterativa y se puede utilizar en todos los tipos de Machine learning

Como puedes ver, el Machine Learning tiene grandes posibilidades de aplicación en cualquier área. En cuanto a la aplicación de esta herramienta para las empresas depende, principalmente, de los datos que estén disponibles. Se puede detectar fraude en transacciones bancarias, predecir fallos en equipos productivos, seleccionar clientes potenciales basándose en comportamientos en redes o en compra presencial, predecir el tráfico, realizar diagnósticos médicos basados en síntomas del paciente, entre muchas otras. Conversemos y apliquemos Machine Learning en tu empresa.