El trabajo de las compañeras de Gradiant Nora M. Villanueva y Marta Sestelo resultó galardonado en la tercera edición de esta conferencia internacional
El European R Users Meeting (eRum) es el mayor encuentro europeo de usuarios profesionales de software libre y lenguaje de programación R
El pasado mes de mayo, os contamos que Budapest acogió la tercera edición del European R Users Meeting (eRum 2018), una conferencia internacional que tiene como objetivo la transferencia de conocimiento y el encuentro entre usuarios profesionales del entorno de software libre y lenguaje de programación R, enfocado al análisis estadístico. Hasta allí se desplazaron nuestras compañeras Nora M. Villanueva y Marta Sestelo quienes, además de conocer las novedades en este campo y formarse, presentaron un trabajo conjunto que finalmente ha resultado premiado por parte de la organización del evento.
El proyecto, titulado Finding groups in time-to-event data by means of the clustcurv package y que se ha desarrollado e implementado en un paquete de R, permite agrupar curvas de supervivencia mediante técnicas clustering o de agrupación de manera automática, con el objetivo de configurar una herramienta útil para la toma de decisiones en las organizaciones que trabajan con un gran volumen de datos, como las pertenecientes a la Industria 4.0.
“La idea de este trabajo era definir un nuevo algoritmo que permitiese agrupar curvas similares para poder tomar decisiones en función de estas agrupaciones” comenta Nora M. Villanueva, investigadora del área de Servicios y Aplicaciones de Gradiant, quién reconoce que, con un ejemplo, se entiende mejor “en todas las organizaciones se trabaja con una gran cantidad de curvas sobre el comportamiento de diferentes elementos, como puede ser el funcionamiento de una máquina, los clientes que se dan de baja en un servicio concreto o la vida útil de las piezas que se producen en una fábrica. Nuestro algoritmo permite agrupar dichas curvas por similitud, mostrando qué elementos se comportan de una manera similar”.
Un trabajo innovador en técnicas clustering
En la actualidad, las técnicas clustering permiten agrupar las curvas en función del número de grupos que se hayan prefijado. “Lo novedoso de nuestro algoritmo es que, además de realizar esta agrupación, podemos conocer -con una significación estadística- cuántos grupos diferentes hay” apunta Marta Sestelo, investigadora en el área de INetS de Gradiant. Precisamente esta es la característica más importante y diferenciadora de la herramienta, ya que la elección del número de grupos se hacía hasta el momento de acuerdo con el criterio de cada investigador de manera subjetiva y poco automática. Además, esta metodología se encuentra implementada dentro de una librería de R, un lenguaje de programación y entorno de código libre a disposición de todo aquel que lo necesite, como la comunidad científica u otras organizaciones.
Una herramienta transversal
El resultado del trabajo tiene aplicación directa en diferentes sectores dónde resulte necesario estimar la probabilidad de que un suceso o ‘evento’ ocurra en un tiempo determinado. Banca, seguros o cualquier empresa que opere dentro del sector de la Industria 4.0 puede beneficiarse de este proyecto, ya que podría agrupar curvas de tiempo hasta el evento, siendo éste el fallo de una pieza, la morosidad de clientes o la mortalidad de cultivos en una piscifactoría, por ejemplo.
Además, este desarrollo también tiene cabida en otros ámbitos como el de la medicina o la educación. “Podemos aplicarlo en nuestro trabajo diario con las diferentes tecnologías en las que en Gradiant somos expertos, como por ejemplo en proyectos de eLearning aplicados a las aulas en los que se quiera estudiar el abandono de los estudiantes en un curso en particular”, indica Nora M. Villanueva.
La versatilidad del proyecto ha hecho que otras entidades internacionales también se hayan interesado, como la prestigiosa revista ‘Statistics in Medicine’ especializada en el campo de la estadística y la probabilidad. Por el momento, el trabajo ya ha recibido el reconocimiento de todo el equipo de eRum 2018, un evento internacional al que este año acudieron más de 500 profesionales de 19 países distintos para seguir las conferencias y presentaciones de más de una treintena de oradores de distintas universidades y empresas reconocidas a nivel internacional como Rstudio, Microsoft, H2o.ai o Mango Solutions .