Las preferencias pornográficas de un juez y la medicación utilizada por un parlamentario alemán se encontraban entre los datos personales descubiertos por dos investigadores alemanes que adquirieron los hábitos de navegación «anónimos» de más de tres millones de ciudadanos alemanes.

¿Qué pensarías? Si alguien apareciera en tu puerta diciendo: ‘Oye, tengo tu historial de navegación completo, todos los días, cada hora, cada minuto, cada clic que hiciste en la web durante el último mes’? ¿Cómo crees que lo conseguimos: algún hacker turbio? No. Fue mucho más fácil: puedes comprarlo».

En realidad, conseguir la información era incluso más fácil que comprarla. Los investigadores crearon una empresa de marketing falsa, con su propio sitio web, una página de LinkedIn para su director ejecutivo e incluso un apartado trabaje con nosotros, que obtuvo algunas solicitudes de trabajo de usuarios engañados.

Llenaron la web señuelo de buenas imágenes y algunas palabras de moda de marketing, se afirmaba haber desarrollado un algoritmo de aprendizaje automático que sería capaz de “vender” más eficazmente a las personas, pero solo lo entrenaban con una gran cantidad de datos.

Contactaron con casi un centenar de empresas, y preguntaron si podían tener los datos brutos y el flujo de clics de la vida de las personas. A menudo las empresas respondían ‘¿Examinar datos? Solo  los tenemos para los Estados Unidos.

Los datos que finalmente les fueron entregando  fue de forma gratuita de un Data Broker, que estaba dispuesto a permitirles probar su hipotética plataforma de publicidad de Inteligencia Artificial. Y aunque nominalmente era un conjunto anónimo, pronto fue fácil desanonimizar a muchos usuarios.

Con sólo 10 URL visitadas puede ser suficiente para identificar a alguien de forma única,por ejemplo, empleados  de una empresa + su banco + su pasatiempo + su periódico preferido y su proveedor de telefonía móvil. Al crear «huellas dactilares» a partir de los datos, es posible compararlos con otras fuentes públicas de las URL que la gente ha visitado, como cuentas de redes sociales o listas de reproducción públicas de YouTube.

Una estrategia similar se utilizó para desanonimizar un conjunto de calificaciones publicadas por Netflix para ayudar a los informáticos a mejorar su algoritmo de recomendación: al comparar las calificaciones «anónimas» de las películas con los perfiles públicos en IMDB, los investigadores pudieron desenmascarar a los usuarios de Netflix, incluida una mujer  lesbiana que su entorno no sabia su orientación  y la cual demandó a Netflix por la violación de su privacidad.

Otro descubrimiento a través de la recopilación de datos ocurrió en  Google Translate, dado que almacena el texto de cada consulta que se le envía en la URL. Recientemente se hizo público detalles operativos sobre una investigación alemana de ciberdelincuencia, ya que el detective involucrado estaba traduciendo solicitudes de asistencia a fuerzas policiales extranjeras.

 

Post escrito con información de www.theguardian.com

0 comentarios

Dejar un comentario

¿Quieres unirte a la conversación?
Siéntete libre de contribuir!

Deja una respuesta

Tu dirección de correo electrónico no será publicada.