Los datos son una huella dactilar: reidentificación y anonimato

En este artículo vamos a tratar...

“Se pueden rastrear las migas de pan digitales que vamos dejando por la red”.

Hace unos años el gobierno australiano publicó un conjunto de datos “anonimizados” que comprendía facturas médicas, incluidas todas las recetas y cirugías, de 2,9 millones de personas.Los datos son una huella dactilar

Los nombres y otras características de identificativas se eliminaron de los registros para proteger la privacidad de las personas. Sin embargo, un equipo de investigación de la Universidad de Melbourne descubrió que era fácil identificar a las personas y acceder a su historia clínica. Todo ello, sin contar con su consentimiento, simplemente comparando y cruzando el conjunto de datos con otra información pública disponible. Tras haberse descargado el conjunto de datos 1.500 veces el Gobierno Australiano lo retiró, ya era tarde.

Este es solo es uno de los muchos ejemplos de información aparentemente inocua y “anonimizada” que acaba exponiendo la identidad de las personas. A medida que las personas aumentan su actividad en la red aumenta su exposición, dejando migas de pan digital que les acaba identificando de una forma que nunca esperaban.

Investigadores alemanes pudieron identificar a las personas en función de sus patrones de navegación web “anónimos”.

Las preferencias pornográficas de un juez y la medicación utilizada por un parlamentario alemán se encontraban entre los datos personales descubiertos por dos investigadores alemanes que adquirieron los hábitos de navegación “anónimos” de más de tres millones de ciudadanos alemanes.

Uno de los primeros ejemplos de la deficiente anonimización ocurrió en 1996, cuando la Comisión de Seguros del Grupo Massachusetts publicó datos “anonimizados” que mostraban las visitas al hospital de los empleados estatales. Al igual que con los datos australianos, el estado eliminó identificadores obvios como nombre, dirección y número de seguro social. Solo fue necesario utilizar el código postal y la fecha de nacimiento junto con información publicada en RRSS para identificar a las personas.

Se pudo demostrar que el 87 % de la población de los Estados Unidos podía quedar identificada de manera única por su fecha de nacimiento, género y códigos postales de cinco dígitos.

Los datos que pueden parecer anónimos no lo son necesariamente. Recientemente se mostró como identificar a la gran mayoría de la población a partir de los patrones de comportamiento revelados por los datos de ubicación de los teléfonos móviles. Al analizar una base de datos de de las ubicaciones de teléfonos móviles (basada en la antena más cercana) de 1,5 millones de personas durante 15 meses (sin otra información de identificación), fue posible identificar de forma única al 95% de las personas con solo cuatro puntos de datos de lugares y horarios. Alrededor del 50 % podría identificarse desde solo dos puntos.Los cuatro puntos podrían provenir de información que está disponible públicamente, incluida la dirección particular de una persona, la dirección de trabajo y las publicaciones de Twitter geoetiquetadas.

“Los datos de ubicación son una huella dactilar. Es una información que existe en una amplia gama de conjuntos de datos y potencialmente podría usarse como identificador global”

Esto puede parecer el sueño de un acosador. Te mueves de casa al trabajo en patrones bastante regulares, una persona que vive en la dirección A y trabaja en la dirección B.

Incluso si los datos de ubicación no revelan la identidad de un individuo, todavía pueden poner en riesgo a grupos de personas.

Por ejemplo Un mapa público publicado por la aplicación de fitness Strava, se convirtió inadvertidamente en un riesgo para la seguridad nacional, ya que reveló la ubicación y los movimientos de personas en bases militares secretas.

Tambien se demostró que era posible identificar al propietario de una tarjeta de crédito entre los millones de cargos. Todo esto, con solo conocer un puñado de compras de esa persona.

Con los nombres y ubicaciones de las tiendas donde se realizaron las compras, fechas aproximadas y los montos de compra, se pudo identificar al 94 % de las personas. Esto significa que alguien podría encontrar una foto tuya de Instagram, un tweet sobre una compra reciente y un recibo antiguo, y podría emparejarla con todo tu historial de compras.

Una foto en las redes sociales podría eventualmente llevar de vuelta a todo su historial de transacciones.

Queda claro que no es posible anonimizar los datos aislados olvidando con lo que se puede cruzar esa información. Puede haber funcionado en el pasado, pero ya no funciona.

Poco podemos hacer los ciudadanos para protegernos de este tipo de intrusión en la privacidad. Una vez que nuestros datos salen, tienden a almacenarse para siempre. Hay empresas que se especializan en combinar datos sobre nosotros. Así, consiguen crear expedientes virtuales y aplicar la minería de datos para influir en nosotros de varias maneras.

Es posible reducir nuestra huella digital, pagando en efectivo o abandonando el teléfono móvil, pero eso no es algo realista.

Lo que es importante saber es que no tenemos capacidad para restringir la cantidad de datos que nos están aspirando. También hace que sea extremadamente difícil para el individuo dar su consentimiento e informarse sobre cómo las aplicaciones o servicios recopilan sus datos. Las promesas hechas por las empresas de no compartir información personal carecen de sentido cuando es tan fácil volver a identificar a alguien.

El RGPD es una buena regulación pero uno de sus problemas es que atribuye demasiada responsabilidad al consumidor. Además, en un entorno donde no está preparado para comprender los riesgos. La idea es no perder el control de los datos y garantizar que los sujetos permanezcan anónimos. La privacidad no está muerta la necesitamos y poco a poco vamos a llegar allí.

Post escrito con información extraída en www.theguardian.com

Cookie	Duración	Descripción
_GRECAPTCHA	5 months 27 days	This cookie is set by the Google recaptcha service to identify bots to protect the website against malicious spam attacks.
_wpfuuid	1 year 1 month 4 days	This cookie is used by the WPForms WordPress plugin. The cookie is used to allows the paid version of the plugin to connect entries by the same user and is used for some additional features like the Form Abandonment addon.
cookielawinfo-checkbox-advertisement	1 year	Set by the GDPR Cookie Consent plugin, this cookie records the user consent for the cookies in the "Advertisement" category.
cookielawinfo-checkbox-analytics	1 year	Set by the GDPR Cookie Consent plugin, this cookie is used to record the user consent for the cookies in the "Analytics" category .
cookielawinfo-checkbox-functional	1 year	The GDPR Cookie Consent plugin sets the cookie to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	1 year	Set by the GDPR Cookie Consent plugin, this cookie is used to record the user consent for the cookies in the "Necessary" category .
cookielawinfo-checkbox-others	1 year	Set by the GDPR Cookie Consent plugin, this cookie is used to store the user consent for cookies in the category "Others".
CookieLawInfoConsent	1 year	Records the default button state of the corresponding category & the status of CCPA. It works only in coordination with the primary cookie.

Cookie	Duración	Descripción
spam-destroyer-f322ea27ee491c037b0f5149d5ee3a85	1 hour	No description
VISITOR_PRIVACY_METADATA	5 months 27 days	Description is currently not available.

Cookie	Duración	Descripción
fr	3 months	Facebook sets this cookie to show relevant advertisements to users by tracking user behaviour across the web, on sites that have Facebook pixel or Facebook social plugin.
guest_id	1 year 1 month	Twitter sets this cookie to identify and track the website visitor. It registers if a user is signed in to the Twitter platform and collects information about ad preferences.
VISITOR_INFO1_LIVE	5 months 27 days	YouTube sets this cookie to measure bandwidth, determining whether the user gets the new or old player interface.
YSC	session	Youtube sets this cookie to track the views of embedded videos on Youtube pages.

Cookie	Duración	Descripción
pll_language	1 year	Polylang sets this cookie to remember the language the user selects when returning to the website and get the language information when unavailable in another way.
sb	2 years	This cookie is used by Facebook to control its functionalities, collect language settings and share pages.

Los datos son una huella dactilar: reidentificación y anonimato

“Se pueden rastrear las migas de pan digitales que vamos dejando por la red”.

Investigadores alemanes pudieron identificar a las personas en función de sus patrones de navegación web “anónimos”.

Se pudo demostrar que el 87 % de la población de los Estados Unidos podía quedar identificada de manera única por su fecha de nacimiento, género y códigos postales de cinco dígitos.

Tambien se demostró que era posible identificar al propietario de una tarjeta de crédito entre los millones de cargos. Todo esto, con solo conocer un puñado de compras de esa persona.

Dejar un comentario

Deja una respuesta Cancelar la respuesta

“Se pueden rastrear las migas de pan digitales que vamos dejando por la red”.

Investigadores alemanes pudieron identificar a las personas en función de sus patrones de navegación web “anónimos”.

Se pudo demostrar que el 87 % de la población de los Estados Unidos podía quedar identificada de manera única por su fecha de nacimiento, género y códigos postales de cinco dígitos.

Tambien se demostró que era posible identificar al propietario de una tarjeta de crédito entre los millones de cargos. Todo esto, con solo conocer un puñado de compras de esa persona.

Quizás te interese

Dejar un comentario

Deja una respuesta Cancelar la respuesta