Privacidad de usuarios: ¿es posible anonimizar nuestra ubicación por completo?
En el próximo minuto miles de aplicaciones pedirán a millones de personas que revelen su ubicación. Con ella, los usuarios pueden comprobar a través de su teléfono móvil los horarios de los autobuses, cartelera de cine o información local, y todos ellos dependen de su ubicación actual. Hablamos de datos extremadamente sensibles, por lo que su procesamiento debe hacerse teniendo en cuenta las medidas adecuadas, se trata en definitiva de evitar que su uso pueda comprometer la privacidad de los usuarios.
Los diferentes tipos de privacidad
El término «privacidad» abarca una amplia gama de conceptos y definiciones: privacidad corporal, que significa que tu cuerpo es tuyo y está relacionado con la protección ante procedimientos físicamente invasivos, como las pruebas genéticas; privacidad territorial, que se refiere a la fijación de límites a las intrusiones en el espacio físico, como las empresas o los hogares; privacidad de las comunicaciones, centrada en la seguridad de las comunicaciones, como el correo electrónico o los mensajes a través de WhatsApp; y privacidad de la información, que se refiere al establecimiento de normas que regulen la recopilación, el procesamiento y el tratamiento de datos personales.
Según estos conceptos, la privacidad de localización puede definirse como un tipo especial de privacidad de la información que abarca los derechos de las personas a determinar por sí mismas cuándo, cómo y hasta qué punto puede conocerse y procesarse la información de su localización. En resumen, la cuestión central de la privacidad de la localización es la capacidad de un individuo de controlar el acceso a su localización actual y pasada.
Decenas de empresas que recopilan información sobre nuestra ubicación afirman que los datos recopilados son anónimos y que no suponen ningún riesgo para la privacidad, ya que no asocian los datos a ninguna información directamente identificable como nombres, tarjetas de identificación o direcciones de correo electrónico. Sin embargo, no es tan difícil conectar la identidad de personas reales con un conjunto de puntos (por ejemplo, localizaciones) que aparecen en un mapa. Pongamos como ejemplo tu rutina diaria: ¿cuál es la probabilidad de que otra persona se mueva entre tu casa y tu oficina? Estudios recientes muestran que cuatro puntos elegidos al azar son suficientes para caracterizar de manera única los movimientos del 95% de los usuarios de un conjunto de datos, y con la selección únicamente de dos puntos elegidos al azar todavía sería posible caracterizar más del 50% de ellos. Por lo tanto, los rastros de movilidad pueden considerarse en general como únicos y, por eso no puede afirmarse que un conjunto de datos que solo contenga datos de localización sea anónimo per se.
Anonimización de datos
En general, la anonimización de datos es un procedimiento que permite proteger la privacidad de los datos personales con el objetivo de reducir el riesgo de identificar a las personas que aparecen en una base de datos.
Con carácter general, existen varias técnicas de anonimización de datos que se pueden usar. En el caso de los conjuntos de datos geolocalizados, aunque los nombres o los carnés de identidad ya no estén presentes en el conjunto de datos, el procedimiento también es necesario, pero las técnicas aplicadas difieren de las aplicadas a un conjunto de datos más general. Un ejemplo de estas técnicas podría ser el camuflaje con sus dos enfoques: espacial y temporal. En el primer caso, la precisión de la información sobre la ubicación de un individuo se adapta en función del número de otros individuos dentro del mismo cuadrante; mientras que, en el segundo, la frecuencia de la información temporal se reduce a un intervalo de tiempo en lugar de en una franja temporal.
Actualmente, Gradiant está trabajando en INFINITECH, un proyecto de investigación H2020 cuyo objetivo es proporcionar una cobertura de 360º para aprovechar plenamente los beneficios del IoT, el Big Data y la IA en el sector de las aseguradoras y la banca. El consorcio está formado por líderes mundiales de las TIC y las finanzas, en particular reúne a 48 socios de 16 países de la UE, con un presupuesto de más de 21 millones de euros y, entre las soluciones que aportará el proyecto, se desarrollará una herramienta de anonimización que apoye los datos de localización.
This project has received funding from the European Union’s Horizon 2020 research and innovation programme under grant agreement No 856632
Autora: Marta Sestelo, Responsable Técnico de Data Analytics & AI