De entre los más de 300 científicos y más de una veintena de empresas y periodistas de distintos sectores, Antonio Pita ha sido elegido como el mejor científico de datos a nivel nacional. Y lo ha conseguido adivinando tus gustos cinematográficos. Este murciano, director de Business Analytics en Liberbank, ha creado, utilizando una técnica de procesamiento de información llamada Big Data, un sistema de recomendación de películas a tiempo real.

¿En qué consiste su proyecto 'Sigefilms'?

Es un sistema de recomendación de películas que, a tiempo real y con una serie de algoritmos, es capaz de hacer predicciones sobre qué películas te pueden gustar. Hace tres tipos de predicciones. El primero selecciona solamente tus gustos y preferencias de forma que, si a ti te gustan ciertas películas y esas tienen rasgos similares a otras, va calculando cuáles son las que más te van a gustar. Hay otro sistema que, basado en los gustos de personas parecidas a ti, te recomienda las películas que les interesan, y hay un tercero que junta toda la información de las películas, gustos y preferencias y permite hacer predicciones mucho más sofisticadas. Lo interesante de todo esto es que es a tiempo real y, en el momento en que una persona hace una valoración sobre una película, automáticamente ese resultado se incluye al de todas las demás personas de la plataforma.

En 'Sigefilms' utiliza una técnica llamada Machine Learning, ¿en qué consiste?

Es una disciplina de inteligencia artificial que busca patrones de comportamiento a través de los datos, de forma que conforme los usuarios interaccionan con la plataforma este algoritmo va detectando nuevos patrones y mejorando cada vez más sus predicciones.

¿Qué le ha supuesto ganar la primera edición?

La verdad es que no me lo esperaba, aunque lo realmente importante es que está poniendo el Data Science y el Big Data en el centro de las noticias y en el centro del mundo empresarial y realmente hacía falta, porque es una disciplina que está empezando y que merece un reconocimiento. Lo que importa es que se conozca ya que está entrando en las empresas poco a poco.

¿Había mucha competencia?

Había gente muy buena. Yo conozco a varios. Hay doctores que están dando clases en universidades extranjeras, ingenieros, gente que trabaja en startups... Fue realmente duro.

¿Qué es el Big Data?

El Big Data es una nueva técnica para procesar muchísima información en muy poco tiempo. Es como cuando una persona quiere fabricar una bicicleta, por ejemplo. Va ensamblando y juntando todos los elementos hasta que la crea. Lo que haría el Big Data es que, en vez de tener trabajando muchas horas a una sola persona experta, tienes a mil, y aunque cada una vaya más despacio, al final hacen mucho más que una sola persona. Con el Big Data, en vez de tener todo el trabajo en un solo ordenador se distribuye en mil o dos mil ordenadores, de manera que el trabajo sea más sencillo, pero a la vez mucho mejor y más rápido.

¿Hay algún conflicto entre el derecho a la intimidad y el Big Data?

Entiendo que hay mucho miedo, pero realmente si uno lo piensa, nosotros trabajamos cada día con millones de datos de clientes, pero solo buscamos variables para poder trabajar con ellos o mejorar su gestión de alguna forma. Sabemos sus gustos, pero nada más. Yo no podría dar el nombre de ninguno de mis clientes porque no los conozco. De hecho, las tiendas a las que van posiblemente los conozcan mejor que yo, aunque trabaje con todos sus datos. Por suerte en España y en Europa tenemos la Ley Orgánica de Protección de Datos que contempla todos los usos que le puedes dar a la información y todos los permisos que necesitas para poder utilizarla desde un punto de vista privado. Está muy bien regulado, de forma que si una persona la utiliza de forma inadecuada dejaría rastro y las penas serían muy graves.

Dijo que la tecnología Big Data actual es tan sólo la punta del iceberg de lo que representará en un futuro próximo...

Bueno, estamos viviendo realmente una revolución; la que muchos llaman la tercera revolución industrial. Antes podías gestionar un número limitado de clientes o de procesos industriales y, ahora, con la información publica y con las técnicas de Machine learning, puedes tener una capacidad exponencial, de forma que esto va a producir un cambio en todos los procesos productivos y comerciales de todas las empresas.

¿Tiene algún proyecto nuevo en mente?

Tenemos muchos proyectos en el trabajo, pero particularmente tengo otros muchos docentes. Hay que hacer un sacrificio entre todos los que estamos en el mercado por formar a gente para que pueda avanzar en este campo. Hay mucho trabajo en Estados Unidos o Inglaterra, que llevan alertando ya varios años de que les hace falta gente en este sector porque no es suficiente con la gente que sale de sus universidades y en España ni siquiera hemos empezado a formar en esta disciplina.