Héctor Cerezo, Gradiant
Las tecnologías 2.0 han supuesto un enorme cambio en las vidas de las personas, proporcionándoles mayor libertad y conectividad. Mediante los dispositivos electrónicos, los usuarios reciben gran cantidad de información con la que interactúan y sobre la que realizan valoraciones personales. Contenidos que les ha resultado interesante y entretenido, o por el contrario, han considerado “spam”.
Para mejorar la experiencia de usuario, las empresas utilizan los gustos del usuario para ofrecerles contenido personalizado, también conocido como recomendaciones. Dichas recomendaciones están basadas en información personal, gustos, hábitos, etc. que se obtienen de los usuarios cuando estos realizan búsquedas por internet, realizan compras en tiendas de comercio electrónico o utilizan servicios en red. Una de las principales formas de recomendación es el filtrado colaborativo. Esta estrategia se basa en recomendar productos a un usuario que le han interesado a otros usuarios con preferencias similares a las suyas.
Conforme crecen las posibilidades de interactuación con el usuario también lo hace la información generada durante el proceso. El nuevo paradigma big data requiere de plataformas para procesar ese enorme volumen de datos de forma eficiente. Hadoop, principal tecnología big data, no es apropiada para hacer recomendaciones en tiempo real por lo que nuevas tecnologías como Apache Spark ofrecen soluciones escalables y hasta 100 veces más rápidas realizando las mismas tareas.
Una de las empresas que está apostando fuerte por Apache Spark es Spotify (servicio de streaming de música online), que emplea esta herramienta para realizar recomendaciones de canciones a los usuarios, en función de sus selecciones pasadas. En el proceso, realizan operaciones de filtrado colaborativo sobre 20 millones de canciones y 20 millones de usuarios.
En Gradiant trabajamos en novedosas soluciones para el tratamiento de información de plataformas de comercio electrónico, usando Apache Spark para realizar nuevos recomendadores más escalables y precisos. Esto lo combinamos con visualizaciones web en tiempo real, que permiten a los analistas acceder a la información de forma más sencilla e intuitiva.