Big data y privacidad: ¿Cuáles son los riesgos de privacidad? El | VPNOverview

En las últimas décadas, el mundo ha cambiado enormemente en muchos aspectos, especialmente en lo que respecta a TI. La cantidad de personas con las que podemos comunicarnos a diario ha crecido enormemente, al igual que la cantidad de información a la que tenemos acceso. Sin embargo, lo mismo es cierto para la cantidad de información que las grandes compañías recopilan sobre nosotros. Términos como big data se utilizan con mayor frecuencia a medida que pasa el tiempo. Pero, ¿qué significa esto exactamente? ¿Qué es big data? ¿Es peligroso? ¿Cómo afecta nuestra privacidad, si es que lo hace? Estas son algunas de las preguntas que cubriremos en este artículo..


¿Qué es Big Data??

Lista con lupaEl término “big data” describe las enormes cantidades de datos (personales) que los diferentes actores recopilan continuamente. Un ejemplo sería toda la información que Google recopila sobre las consultas de búsqueda de sus usuarios. El fenómeno de los grandes datos es un desarrollo relativamente reciente que comenzó porque las compañías (grandes) y organizaciones, como Facebook, Google y la mayoría de los gobiernos, comenzaron a recopilar cada vez más datos sobre sus usuarios, clientes y ciudadanos que antes. Las nuevas tecnologías, un mundo digitalizado e Internet han ayudado enormemente a este desarrollo..

Las colecciones de big data a menudo son tan vastas que es imposible analizarlas utilizando el análisis de datos tradicional. Sin embargo, si uno analiza los grandes datos de la manera correcta, se pueden inducir patrones y conclusiones interesantes. Por ejemplo, los grandes datos a menudo se usan para estudios de mercado a gran escala: ¿qué productos tienen más probabilidades de comprarse? ¿Qué tipo de publicidad es más efectiva cuando desea llegar y persuadir a los clientes??

Para que un conjunto de datos se considere big data, generalmente debe cumplir con los siguientes tres criterios, también conocidos como 3 v:

  • Volumen: Big data es cualquier cosa menos una pequeña muestra. Implica vastas colecciones de datos, resultantes de una observación larga y continua..
  • Velocidad: Esto tiene que ver con las impresionantes velocidades a las que se recopilan grandes datos. Además, a menudo se puede acceder a Big Data en tiempo real (a medida que se recopila).
  • Variedad: Los grandes conjuntos de datos a menudo contienen muchos tipos diferentes de información. Los datos dentro de grandes conjuntos de datos podrían incluso combinarse para llenar cualquier vacío y hacer que el conjunto de datos sea aún más completo.

Aparte de estos 3 v, big data tiene algunas otras características. Por ejemplo, los grandes datos son excelentes para el aprendizaje automático. Esto significa que puede usarse efectivamente para enseñar ciertas tareas a las computadoras y máquinas. Además, como ya hemos mencionado brevemente, los grandes datos se pueden usar para detectar patrones. Esto ocurre principalmente de una manera muy efectiva, por medio de computadoras que trabajan en los datos. Finalmente, el big data es el reflejo de las huellas digitales de los usuarios. Esto significa que es un subproducto de las actividades digitales y en línea de las personas y se puede utilizar para crear perfiles personales individuales..

Diferentes tipos de big data

Hay diferentes formas de clasificar big data. La primera forma, que se usa con mayor frecuencia, diferencia los grandes datos en función del tipo de datos que se recopilan. Las tres categorías posibles utilizadas para este tipo de clasificación son: Big Data estructurado, Big Data no estructurado y Big Data semiestructurado.

  1. Estructurado: Cuando los grandes datos están estructurados, se pueden guardar y presentar de manera organizada y lógica, haciendo que los datos sean más accesibles y fáciles de comprender. Un ejemplo sería una lista de direcciones de clientes creadas por una empresa. En esta lista, es probable que encuentre los nombres, las direcciones y quizás otros detalles de los clientes, como números de teléfono, todo claramente estructurado en, por ejemplo, un cuadro o tabla.
  2. Desestructurado: Big Data no estructurado no está organizado en absoluto. Carece de una presentación lógica que tenga sentido para el ser humano promedio. Big data no estructurado no tiene la estructura de, por ejemplo, una tabla que denota una cierta coherencia entre los diferentes elementos del conjunto de datos. Por lo tanto, este tipo de datos es bastante difícil de navegar y comprender. Muchos conjuntos de datos comienzan inicialmente como big data no estructurado.
  3. Semiestructurada: El big data semiestructurado, como habrás adivinado, tiene características de big data estructurado y no estructurado. La naturaleza y la representación de este tipo de datos no son completamente arbitrarias. Sin embargo, tampoco está lo suficientemente estructurado y organizado como para ser utilizado para un análisis significativo. Un ejemplo sería una página web que contiene etiquetas específicas de metadatos (información adicional que no es directamente visible en el texto), por ejemplo, porque contiene ciertas palabras clave. Estas etiquetas muestran de manera efectiva fragmentos específicos de información, como el autor de una página o el momento en que se colocó en línea. El texto en sí no está estructurado, pero las palabras clave y otros metadatos que contiene ayudan a que sea una base adecuada para el análisis..

Clasificación basada en la fuente de big data

Otra forma común de distinguir entre diferentes tipos de big data es mirando la fuente de los datos. ¿Quién o qué ha generado la información? Al igual que la disposición anterior, este método de clasificación también consta de 3 categorías diferentes.

  1. Personas: Esta categoría se refiere a grandes datos generados por personas. Los ejemplos serían libros, imágenes, videos, así como información y datos (personales) en sitios web y redes sociales, como Facebook, Twitter, Instagram, etc..
  2. Proceso de registro: Esta categoría incluye el tipo más tradicional de big data, que es recopilado y analizado por (grandes) empresas para mejorar ciertos procesos en un negocio.
  3. Máquinas: Este tipo de big data resulta del número cada vez mayor de sensores que se colocan en las máquinas. Un ejemplo sería el sensor de calor que a menudo está integrado en los procesadores de computadora. Los datos generados por las máquinas a menudo pueden ser muy complejos, pero al menos este tipo de big data generalmente está bien estructurado y completo.

¿Para qué se puede usar Big Data??

logo de FacebookTodo lo discutido hasta ahora puede sonar algo abstracto. Hagamos las cosas un poco más concretas y discutamos algunas aplicaciones de big data de la vida real. Después de todo, hay muchas, muchas maneras en que las empresas y organizaciones usan big data. Una de las primeras cosas que viene a la mente es la enorme cantidad de datos que las compañías recopilan sobre nosotros. Facebook recopila datos sobre todos sus usuarios y los analiza para decidir qué mostrarle en su línea de tiempo. Por supuesto, esto se hace para satisfacer sus deseos e intereses personales. Facebook espera que esto te permita permanecer en su sitio web por períodos de tiempo más largos. A su vez, Amazon recopila información sobre sus clientes y los productos que compran. De esa manera, Amazon puede recomendar productos que creen que le interesarán y aumentar sus ganancias de esta manera..

Sin embargo, los grandes datos también se usan de maneras completamente diferentes a las estrategias comerciales descritas anteriormente. Por ejemplo, las compañías de transporte público pueden recopilar datos sobre cuán ocupadas están ciertas rutas. Posteriormente, podrían analizar estos datos para decidir, por ejemplo, qué rutas requieren autobuses o trenes adicionales. Otro caso bien conocido de uso efectivo de big data se refiere al gigante de entrega internacional UPS. UPS utiliza un software especial que se desarrolló después del análisis de big data. Este software ayuda a los conductores de UPS a evitar giros a la izquierda, que son más costosos, más derrochadores y más peligrosos que los giros a la derecha. Supuestamente, este sistema ya ha ahorrado a UPS millones de galones de combustible, todo gracias a los grandes datos.

Otro ejemplo interesante de recopilación de grandes datos son las pruebas de ADN y sitios web como MyHeritage DNA. Este sitio web afirma que puede ayudarlo a “descubrir sus orígenes étnicos y encontrar nuevos familiares” con una simple prueba de ADN. Huelga decir que este proceso implica una gran cantidad de recopilación de datos y referencias cruzadas, lo que lo convierte en otro jugador importante en la recopilación y el uso de grandes datos. Las pruebas de ADN físicas “tradicionales” también implican una gran cantidad de grandes datos, ya que las empresas que realizan estas pruebas obtendrán conjuntos de datos extremadamente grandes sobre muchas, muchas personas. Por supuesto, es importante ser consciente de los posibles riesgos que conllevan estos procesos de recopilación de grandes datos. Estos riesgos se resaltarán en la siguiente parte de este artículo..

¿Es peligroso el big data??

Como se muestra arriba, los grandes datos pueden ser increíblemente útiles en muchos casos. Nos proporciona toneladas de información que podemos usar para optimizar los procesos y hacer que las empresas sean más eficientes y rentables. Sin embargo, esto no significa que recopilar y utilizar big data esté completamente libre de riesgos. Hay cinco riesgos importantes que vienen con Big Data. Discutiremos los cinco aquí.

Hackers y ladrones

Con todo lo que hacemos en línea, existe el riesgo inherente de que nuestros datos personales e información sobre nuestras actividades en Internet puedan ser robados. Todo usuario de internet debe ser consciente de esto. El número de filtraciones y robos de datos ha aumentado drásticamente en los últimos años. A menudo hay historias en las noticias sobre delincuentes que venden conjuntos de datos que contienen contraseñas y otra información sobre lugares como la web oscura. A menudo, estos conjuntos de datos son robados de sitios web oficiales, empresas y organizaciones. Cuanto más grandes son estos conjuntos de datos, más interesante resulta para los ladrones intentar obtenerlos. Si consiguen estos conjuntos de datos, podrían causar muchos problemas. No hace falta decir que esto también podría comprometer enormemente su privacidad..

Intimidad

La práctica de recopilar datos personales se está generalizando cada vez más. Sin embargo, las regulaciones de privacidad actuales no pueden mantenerse al día con los rápidos desarrollos tecnológicos que hacen posible esta práctica. Esto deja espacio para áreas grises e incertidumbres que no se pueden resolver al observar la ley. Las preocupaciones importantes de privacidad que surgen incluyen: ¿Qué tipo de datos se puede recopilar? ¿Acerca de quien? ¿Quién debe tener acceso a estos datos??

Cuando se recopilan grandes cantidades de datos, las posibilidades de que se incluya información personal confidencial en esos conjuntos de datos son altas. Esto es problemático, incluso cuando los piratas informáticos y los ladrones no están en juego. Después de todo, cualquier persona con malas intenciones podría abusar de los datos sensibles a la privacidad. Esto incluye compañías y organizaciones (maliciosas).

Mal análisis de datos

Muchas empresas y organizaciones recopilan grandes datos, porque pueden usarlos para análisis interesantes. Esto podría darles nuevas ideas importantes sobre lo que sea que estén investigando (como, por ejemplo, los hábitos del consumidor). A su vez, estas ideas y conclusiones podrían traducirse en cambios dentro de la empresa que resultan en mayores márgenes y más ganancias. Sin embargo, al igual que con cualquier otro conjunto de datos normal, un análisis incorrecto de big data puede tener serias consecuencias. Después de todo, un análisis inadecuado puede llevar fácilmente a conclusiones erróneas. Esto a su vez puede traducirse en medidas ineficaces o incluso contraproducentes..

Recopilando los datos “incorrectos”

Big data se está volviendo cada vez más popular y las organizaciones están cada vez más dispuestas a recopilar todo tipo de datos. Esto significa que se están recopilando grandes cantidades de datos sin que haya una razón clara para analizarlos. En otras palabras, crea una enorme base de datos de información en bruto que se ha recopilado por si acaso. Es probable que las empresas piensen que es bastante fácil recopilar todos esos datos, por lo que también podrían hacerlo. No hace falta decir que esto no es bueno para la privacidad de nadie. Incluso podría conducir a la recopilación y análisis de datos irrelevantes o “incorrectos”. Si las conclusiones extraídas de este análisis se utilizan en la gestión, podría conducir a las mismas medidas ineficaces mencionadas en el párrafo anterior..

Recopilar y guardar grandes datos con malas intenciones

Las empresas, organizaciones y gobiernos utilizan cada vez más la recopilación de big data para que puedan crear perfiles individuales precisos sobre las personas. A los usuarios o ciudadanos casi nunca se les notifica cuál de sus datos personales se está registrando, y mucho menos por qué y cómo. No hace falta decir que esto tiene serias implicaciones para su privacidad en línea. Todo lo que hacen en línea, se puede guardar y ver más tarde. Además, los grandes recolectores de datos podrían influir y manipular fácilmente la toma de decisiones de las personas mediante el análisis y el uso de los datos recopilados..

Big data y privacidad

Smartphone con imagen de orejaComo probablemente comprenderá a estas alturas, los grandes datos conllevan muchas desventajas y riesgos. Sin embargo, muchas empresas y organizaciones aún recopilan datos a gran escala, principalmente debido a cómo pueden ayudarlos a crecer y avanzar. Recopilar big data es más fácil que nunca. Esto tiene enormes consecuencias para nuestra privacidad. Ya hemos discutido brevemente los posibles peligros de privacidad de las partes maliciosas que recopilan datos incorrectos. Dado que nuestra privacidad está tan estrechamente vinculada a la recopilación masiva de datos personales, queremos usar esta sección para analizar las diferentes preocupaciones de privacidad que vienen con los grandes datos.

Recopilación de datos a gran escala.

Muchas empresas, incluidas Google, Facebook y Twitter, dependen en gran medida de los anuncios para mantenerse y obtener ganancias. Para que estos anuncios sean lo más efectivos posible, estas compañías crean perfiles detallados de sus usuarios, especialmente teniendo en cuenta sus gustos e intereses. Esta es una forma de big data. Del mismo modo, los gobiernos y los servicios secretos también dependen del big data. Utilizan esta gran cantidad de información para rastrear e investigar a las personas que consideran sospechosas. Por supuesto, esto también significa que hay muchos datos importantes para que los ciberdelincuentes tengan en sus manos y tal vez incluso manipulen y abusen. Esto puede crear todo tipo de problemas relacionados con la privacidad y la identidad. Uno que viene a la mente es el robo de identidad..

Aún así, las posibilidades que vienen con la colección en las bases de datos son mucho más amplias que esto. En estos días, la tecnología se ha vuelto tan avanzada e “inteligente” que puede combinar conjuntos de datos. ¡Esto se puede hacer de una manera tan inteligente y astuta que las grandes corporaciones y organizaciones probablemente sepan más sobre usted que usted! Quién eres, dónde vives, cuáles son tus pasatiempos, quiénes son tus amigos: ninguna de esta información será privada por más tiempo. No es un pensamiento muy reconfortante, podrías pensar. Afortunadamente, hay algunas maneras de protegerse de la infracción de privacidad a gran escala que los grandes datos pueden causar.

Leyes de privacidad

Cookies en pantallaLas leyes y regulaciones de privacidad pueden protegernos contra la infracción de la privacidad, pero solo hasta cierto punto. Para complicar más las cosas, las leyes de privacidad a menudo difieren mucho entre los diferentes países y regiones. Por ejemplo, en Europa está en vigor una ley de privacidad del consumidor relativamente estricta llamada Reglamento General de Protección de Datos (GDPR). Esta ley se aplica a todos los estados miembros de la UE, aunque los detalles pueden variar según el país. Muchas compañías internacionales han decidido cumplir con todos sus negocios ante el GDPR. Es por eso que Google, por ejemplo, ahora permite a los usuarios solicitar la eliminación de información personal. Sin embargo, las leyes de privacidad en los Estados Unidos difieren de un estado a otro y no protegen a los consumidores ni a la UE. Desafortunadamente, esto es incluso cierto para la ley de privacidad más estricta de los EE. UU., La Ley de Privacidad del Consumidor de California.

En resumen, no existe una ley de privacidad “global” sólida que se aplique a todos los grandes recolectores de datos y proteja a todos los usuarios. Esto significa que nuestra privacidad no solo se ve perjudicada por los grandes recolectores de datos de forma ilegal, sino incluso de manera perfectamente legal, por paradójico que pueda parecer. Afortunadamente, las infracciones de privacidad a gran escala expuestas por denunciantes como Edward Snowden y Chelsea Manning han aumentado considerablemente la conciencia sobre los riesgos de los grandes datos. Por supuesto, este es solo un primer paso para mejorar las leyes de privacidad actuales.

Muchos usuarios de Internet no están dispuestos a esperar una mejora en las leyes de privacidad, y con razón. Más bien, quieren actuar ellos mismos haciendo lo que puedan para proteger su privacidad. ¿Desea evitar formar parte de innumerables grandes conjuntos de datos también? Hay varios consejos y trucos para ayudarte en tu camino.

Cómo evitar que sus datos se guarden en grandes conjuntos de datos

Los grandes conjuntos de datos afectan seriamente su privacidad y seguridad. Estos conjuntos de datos pueden contener todo tipo de información (personal), que podrían ser objeto de abuso por parte de grandes empresas o incluso ciberdelincuentes. Es por eso que siempre debe asegurarse de dejar la menor cantidad de rastros en línea posible. Los siguientes consejos pueden ayudarlo a lograr esto:

  • Intente minimizar el uso de su información personal al crear contraseñas o, en general, en la web. Por ejemplo: evite usar su nombre, dirección, número de teléfono, fecha de nacimiento, etc..
  • Recuerde siempre lo siguiente: todo lo que publique en Internet estará allí para siempre. Es posible que esto no siempre sea completamente cierto, pero este nivel de precaución ayuda a salvaguardar su privacidad. Manejará automáticamente sus datos privados con más cuidado una vez que se dé cuenta de este hecho..
  • Asegúrese de que su conexión a Internet sea segura y anónima, por ejemplo, utilizando el navegador Tor o una VPN..
  • Use uno o varios bloqueadores de anuncios en su navegador.
  • Use en o más complementos del navegador que bloqueen rastreadores y cookies.
  • Borre regularmente su caché y elimine su historial de navegación y cookies.
  • Cierre sesión en sitios web cuando no los esté utilizando activamente.

Tomar estos pasos es un buen comienzo cuando se trata de salvaguardar su privacidad y seguridad en línea. Sin embargo, tenga en cuenta que los grandes datos se recopilan de muchas maneras diferentes, no solo en línea. En resumen, esté donde esté y haga lo que haga, siempre debe estar atento e intentar proteger sus datos (personales) de los grandes recolectores de datos..

Kim Martin
Kim Martin Administrator
Sorry! The Author has not filled his profile.
follow me