Inicio » Machine Learning » Machine Learning vs Investigación: la sucesión de Fibonacci

Machine Learning vs Investigación: la sucesión de Fibonacci

Ya no es ningún secreto que en prácticamente cualquier organización que quiera ser data driven o simplemente, tomar ciertas decisiones en base a datos y automatizar procesos, tiene que hacer uso del Aprendizaje Automático (Machine Learning – ML). Sin embargo, muchas veces no somos conscientes del trabajo que realizan los investigadores para desarrollar fórmulas, modelos y algoritmos que puedan ser utilizados en el ML, sigue leyendo este post para descubrir las principales diferencias entre el Machine Learning y la Investigación.

Machine Learning en la investigación

En muchas compañías en las que todavía se desconoce cómo organizar una estrategia en base al ML, podemos ver algunas decisiones del tipo: “Vamos a contratar un equipo de investigadores en ML formado por científicos con muchas publicaciones, les pagaremos grandes sueldos y de esta forma podremos incorporar el ML en nuestro modelo de negocio”. Sin embargo… ¿Cómo negocio realmente necesitamos un equipo de investigación?, es más ¿necesitamos Machine Learning? Para responder a estas preguntas es importante que definamos previamente qué es la investigación basada en el Machine Learning.

Dicho en pocas palabras, un investigador en Machine Learning se dedica a obtener modelos o algoritmos a través de la estadística y las matemáticas para que una máquina pueda aprender de forma automática a desempeñar una tarea a través de unos parámetros de entrada (para todos los que ya lleven algún tiempo en este mundo del ML sabrán que efectivamente, nos estamos refiriendo a esos maravillosos vectores y matrices).

Es importante, también, resaltar que, pese a estos grandes conocimientos, una gran mayoría de investigadores en ML no tienen las competencias suficientes como para desplegar en producción modelos de ML.

LEE  Nueva herramienta de autodiagnóstico en Ciberseguridad para Pymes

Machine Learning en el negocio

Un problema de Aprendizaje Automático resuelto por la vía científica (la investigación), puede tardar años en resolverse, para ello es necesario encontrar otros problemas similares, formular hipótesis…

Tanto para el mundo de la investigación como en una compañía para resolver un problema de Machine Learning lo primero que necesitamos es obtener ejemplos (datos) suficientes de posibles inputs que serán la entrada a nuestro algoritmo y los posibles o deseados outputs de este. Por supuesto, tendremos que hacernos con un buen equipo hardware (cada vez se emplean con más asiduidad las GPU) para procesar los algoritmos. Desarrollar (o adquirir) el software que se encargue de la ejecución del algoritmo y esperar ya sean minutos u horas para comprobar los resultados.

Comparativa entre el ML e investigación. La secuencia de Fibonacci

Para hacer más efectiva esta comparativa, vamos a tomar como referencia un ejemplo que compara cómo aprende un modelo de ML y una investigación científica ante la secuencia de Fibonacci.

Vamos a tomar como referencia los primeros números de la secuencia, imaginemos que nuestro objetivo es predecir los siguientes valores:

Posición 1 2 3 4 5 6 7 8 9
Valor 1 1 2 3 5 8 13 21 34

 

Como podemos ver en la secuencia la posición 8 corresponde con el valor 21, ahora bien, ¿cuál sería el valor que podría representar la posición 284?

Enfoque del Machine Learning

En vista de la secuencia, sí, podríamos hacer uso del ML para predecir el valor n de la serie. Para ello necesitaríamos lo siguiente:

  • Un gran conjunto de ejemplos de entrenamiento (train set), que contendrían los pares de posición, valor, en este caso, podemos representarlos con tuplas: (1,1), (3,2), (7, 13), (8, 21).
  • Una gama de algoritmos que nos permitan construir una función para predecir y ajustar estos parámetros internos para que el algoritmo aprenda desde los ejemplos.

Este procedimiento (en teoría) debe hacerse una sola vez. Posteriormente, cada vez que queramos predecir un valor en una cierta posición utilizaremos la función de predicción de nuestro algoritmo, importante, no siempre vamos a acertar. Cuando los resultados no son los esperados lo que comúnmente sucede es:

  • Tratar de obtener más ejemplos para reentrenar el algoritmo (esto supone más tiempo y a veces más dinero).
  • Utilizar proveedores de software que utilicen librerías de ML que garanticen buenos resultados (más dinero), en lugar de utilizar algunas de uso libre.
  • Si queremos reducir el tiempo de entrenamiento y el tiempo que utiliza el algoritmo en producir una respuesta, siempre podemos hacer uso de la computación en la nube, comprando más instancias en AWS (de nuevo, más dinero).
LEE  Uso de datos abiertos en machine learning

Como podemos ver en la gran mayoría de las situaciones cuando los resultados no son suficientes, es muy probable que toque invertir más dinero.

Enfoque de la investigación

Si en lugar de gastar dinero (no siempre tiene porque ser así), podemos realizar investigación, en este caso concreto la secuencia de Fibonacci puede representarse con la siguiente fórmula:

  Fórmula general secuencia Fibonacci
Imagen 1:  Fórmula general secuencia Fibonacci

Esta fórmula es trivial y puede ser representada por cualquier programa, mediante la investigación puede cambiar el paradigma, es decir, ya no vamos a hacer una predicción del valor en la posición 248, simplemente vamos a calcularlo. Podemos garantizar que el uso de la fórmula nos dará siempre el resultado correcto.

Realizando más investigación, podemos descubrir que la fórmula utilizada anteriormente puede ser mejorada hasta su forma cerrada (matemáticamente hablando).

 

Forma cerrada secuencia de Fibonacci
Imagen 2: Forma cerrada secuencia de Fibonacci

Como puede comprobarse a simple vista, esta fórmula es mucho más compleja y requiere más esfuerzo para entenderla, pero es mucho más rápida. En este caso, la conclusión ha sido que invertir en investigación nos ha permitido optimizar al máximo un problema y obtener siempre el resultado correcto de una forma rápida.

En conclusión, especialmente, desde el punto de vista de una compañía, aplicar técnicas de ML para predecir y automatizar procesos tiene más sentido que emplear la investigación, ya que podemos llegar a buenos resultados rápidamente. Si queremos mejores resultados, habrá que investigar.

A través del ML no podemos obtener una base sobre la cuál podamos construir resultados en base a los anteriores, ya que esto por el momento, es una tarea de la ciencia (como hemos visto a través de la fórmula de la secuencia de Fibonacci).

LEE  Adversarial Machine Learning. ¿Qué es?

El ML puede ser el mejor aliado para obtener resultados a medio-corto plazo, ya que, por ejemplo, para obtener la forma cerrada de la secuencia de Fibonacci los investigadores tardaron 400 años.

 

Juan Manuel Moreno, tutor del Master en Big Data y Business Analytics.

 

Formación Relacionada

Las dos pestañas siguientes cambian el contenido a continuación.
Equipo de profesionales formado esencialmente por profesores y colaboradores con amplia experiencia en las distintas áreas de negocio del mundo empresarial y del mundo académico. IMF Smart Education ofrece una exclusiva oferta de postgrados en tecnología en colaboración con empresa como Deloitte, Indra o EY (masters en Big Data, Ciberseguridad, Sistemas, Deep Learning, IoT) y un máster que permite acceder a la certificación PMP/PMI. Para ello IMF cuenta con acuerdos con universidades como Nebrija, la Universidad de Alcalá y la Universidad Católica de Ávila así como con un selecto grupo de universidades de Latinoamérica.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

¡Noticias, eventos y formación!

Suscríbete ahora y recibe los mejores contenidos sobre Negocios, Prevención, Marketing, Energías Renovables, Tecnología, Logística y Recursos Humanos.

Acepto recibir comunicaciones comerciales por parte del grupo IMF
He leído y acepto las condiciones


Machine Learning vs Investigación: la sucesión de Fibonacci

Un investigador en Machine Learning se dedica a obtener modelos o algoritmos a través de la estadística y las matemáticas.