«Se pueden rastrear  las migas de pan digitales que vamos dejando por la red».

Hace unos años el gobierno australiano publicó un conjunto de datos «anonimizados» que comprendía facturas médicas, incluidas todas las recetas y cirugías, de 2,9 millones de personas.

Los nombres y otras características de identificativas se eliminaron de los registros para  proteger la privacidad de las personas, pero un equipo de investigación de la Universidad de Melbourne pronto descubrió que era fácil volver a identificar a las personas y acceder a su historia clínica sin su consentimiento, simplemente comparando y cruzando el conjunto de datos con otra información pública disponible. Tras haberse descargado el conjunto de datos 1.500 veces el Gobierno Australiano lo retiró, ya era tarde.

Este es solo es uno de los muchos ejemplos de información aparentemente inocua y «anonimizada» que acaba exponiendo la identidad de las personas. A medida que las personas aumentan su actividad en la red aumenta su exposición, dejando migas de pan digital que les acaba identificando de una forma que nunca esperaban.

Investigadores alemanes pudieron identificar a las personas en función de sus patrones de navegación web «anónimos».Las preferencias pornográficas de un juez y la medicación utilizada por un parlamentario alemán se encontraban entre los datos personales descubiertos por dos investigadores alemanes que adquirieron los hábitos de navegación «anónimos» de más de tres millones de ciudadanos alemanes.

Uno de los primeros ejemplos de la deficiente anonimización ocurrió en 1996, cuando la Comisión de Seguros del Grupo Massachusetts publicó datos «anonimizados» que mostraban las visitas al hospital de los empleados estatales. Al igual que con los datos australianos, el estado eliminó identificadores obvios como nombre, dirección y número de seguro social. Solo fue necesario utilizar el código postal y la fecha de nacimiento junto con información publicada en RRSS para identificar a las personas.

 Se pudo demostrar que el 87 % de la población de los Estados Unidos podía quedar identificada de manera única por su fecha de nacimiento, género y códigos postales de cinco dígitos.

Los datos que pueden parecer anónimos no lo son necesariamente. Recientemente se mostró como identificar a la gran mayoría de la población a partir de los patrones de comportamiento revelados por los datos de ubicación de los teléfonos móviles. Al analizar una base de datos de de las ubicaciones de teléfonos móviles  (basada en la antena más cercana) de 1,5 millones de personas durante 15 meses (sin otra información de identificación), fue posible identificar de forma única al 95% de las personas con solo cuatro puntos de datos de lugares y horarios. Alrededor del 50 % podría identificarse desde solo dos puntos.Los cuatro puntos podrían provenir de información que está disponible públicamente, incluida la dirección particular de una persona, la dirección de trabajo y las publicaciones de Twitter geoetiquetadas.

«Los datos de ubicación son una huella dactilar. Es una información que existe en una amplia gama de conjuntos de datos y potencialmente podría usarse como identificador global»

Esto puede parecer el sueño de un acosador, te mueves de casa al trabajo en patrones bastante regulares, una persona que vive en la dirección A y trabaja en la dirección B.

Incluso si los datos de ubicación no revelan la identidad de un individuo, todavía pueden poner en riesgo a grupos de personas.

Por ejemplo  Un mapa público publicado por la aplicación de fitness Strava, se convirtió inadvertidamente en un riesgo para la seguridad nacional, ya que reveló la ubicación y los movimientos de personas en bases militares secretas.

Tambien se demostró que era posible identificar al propietario de una tarjeta de crédito entre los millones de cargos «anonimizados» con solo conocer un puñado de compras de esa persona. Solo con los nombres y ubicaciones de las tiendas donde se realizaron las compras, y las fechas aproximadas y los montos de compra, se pudo identificar al 94 % de las personas mirando solo tres transacciones. Esto significa que alguien podría encontrar una foto tuya de Instagram tomando un café con amigos, un tweet sobre una compra reciente y un recibo antiguo, y podría emparejarla con todo tu historial de compras.

Pago seguro

Una foto en las redes sociales podría eventualmente llevar de vuelta a todo su historial de transacciones.

Queda claro que no es posible anonimizar los datos aislados olvidando con lo que se puede cruzar esa información. Puede haber funcionado en el pasado, pero ya no funciona.

Poco podemos hacer los ciudadanos para protegernos de este tipo de intrusión en la privacidad, una vez que nuestros datos salen, tienden a almacenarse para siempre. Hay empresas que se especializan en combinar datos sobre nosotros de diferentes fuentes para crear expedientes virtuales y aplicar la minería de datos para influir en nosotros de varias maneras.

Es posible reducir nuestra huella digital, pagando en efectivo o abandonando el teléfono móvil, pero eso no es algo realista.

Lo que es importante saber es que no tenemos capacidad para restringir la cantidad de datos que nos  están aspirando.También hace que sea extremadamente difícil para el individuo dar su consentimiento e informarse sobre la forma en que cualquier aplicación o servicio recopila sus datos, las promesas hechas por las empresas de no compartir información personal carecen de sentido cuando es tan fácil volver a identificar a alguien.

El RGPD es una buena regulación pero uno de sus problemas es que atribuye demasiada responsabilidad al consumidor en un entorno donde no está preparado para comprender los riesgos. La idea es no perder el control de los datos y garantizar que los sujetos permanezcan anónimos, la privacidad no está muerta la necesitamos y poco a poco vamos a llegar allí.

Post escrito con información extraída en www.theguardian.com

0 comentarios

Dejar un comentario

¿Quieres unirte a la conversación?
Siéntete libre de contribuir!

Deja una respuesta

Tu dirección de correo electrónico no será publicada.