Big data & confidentialité: Quels sont les risques pour la confidentialité? | VPN Présentation

Au cours des dernières décennies, le monde a énormément changé à bien des égards, en particulier en ce qui concerne l’informatique. Le nombre de personnes avec lesquelles nous pouvons communiquer quotidiennement a énormément augmenté, tout comme la quantité d’informations auxquelles nous avons accès. Cependant, il en va de même pour la quantité d’informations que les grandes entreprises collectent sur nous. Des termes tels que les mégadonnées sont de plus en plus utilisés au fil du temps. Mais qu’est-ce que cela signifie exactement? Qu’est-ce que le Big Data? Est-ce dangereux? Comment cela affecte-t-il notre vie privée, le cas échéant? Voilà quelques-unes des questions que nous aborderons dans cet article.


Qu’est-ce que le Big Data?

Liste avec loupeLe terme «big data» décrit les énormes quantités de données (personnelles) qui sont continuellement collectées par différents acteurs. Un exemple serait toutes les informations que Google recueille sur les requêtes de recherche de ses utilisateurs. Le phénomène des mégadonnées est une évolution relativement récente qui a commencé parce que les (grandes) entreprises et organisations, telles que Facebook, Google et la plupart des gouvernements, ont commencé à collecter toujours plus de données sur ses utilisateurs, clients et citoyens qu’auparavant. Les nouvelles technologies, un monde numérisé et Internet ont énormément aidé ce développement.

Les collections de mégadonnées sont souvent si vastes qu’il est impossible de les analyser à l’aide de l’analyse de données traditionnelle. Cependant, si l’on analyse correctement les mégadonnées, des modèles et des conclusions intéressants peuvent être induits. Par exemple, les mégadonnées sont souvent utilisées pour des études de marché à grande échelle: quels produits sont les plus susceptibles d’être achetés? Quel type de publicité est le plus efficace lorsque vous souhaitez toucher et convaincre des clients?

Pour qu’un ensemble de données soit considéré comme des mégadonnées, il doit généralement répondre aux trois critères suivants, également appelés 3 v:

  • Le volume: Les mégadonnées sont tout sauf un petit échantillon. Il implique de vastes collections de données, résultant d’une observation longue et continue.
  • Rapidité: Cela a à voir avec les vitesses impressionnantes de collecte des mégadonnées. De plus, les mégadonnées sont souvent accessibles en temps réel (lors de leur collecte).
  • Variété: Les grands ensembles de données contiennent souvent de nombreux types d’informations différents. Les données dans des ensembles de données volumineux pourraient même être combinées pour combler les lacunes et rendre l’ensemble de données encore plus complet.

Mis à part ces 3 v, les mégadonnées ont d’autres caractéristiques. Par exemple, les mégadonnées sont idéales pour l’apprentissage automatique. Cela signifie qu’il peut être utilisé efficacement pour enseigner certaines tâches aux ordinateurs et aux machines. De plus, comme nous l’avons déjà brièvement évoqué, les mégadonnées peuvent être utilisées pour détecter des modèles. Cela se produit principalement de manière très efficace, au moyen d’ordinateurs travaillant sur les données. Enfin, le big data est le reflet des empreintes digitales des utilisateurs. Cela signifie que c’est un sous-produit des activités numériques et en ligne des gens et peut être utilisé pour créer des profils personnels individuels.

Différents types de Big Data

Il existe différentes façons de classer les mégadonnées. La première méthode, la plus utilisée, différencie les mégadonnées en fonction du type de données collectées. Les trois catégories possibles utilisées pour ce type de classification sont: le big data structuré, le big data non structuré et le big data semi structuré.

  1. Structuré: Lorsque le Big Data est structuré, il peut être enregistré et présenté de manière organisée et logique, ce qui rend les données plus accessibles et plus faciles à comprendre. Un exemple serait une liste d’adresses clients créées par une entreprise. Dans cette liste, on trouverait probablement les noms, adresses des clients et peut-être d’autres détails tels que les numéros de téléphone, tous clairement structurés dans, par exemple, un graphique ou un tableau.
  2. Non structuré: Le Big Data non structuré n’est pas organisé du tout. Il manque une présentation logique qui aurait du sens pour l’être humain moyen. Le big data non structuré n’a pas la structure, par exemple, d’un tableau qui dénote une certaine cohérence entre les différents éléments de l’ensemble de données. Par conséquent, ce type de données est assez difficile à naviguer et à comprendre. De nombreux ensembles de données commencent initialement par des mégadonnées non structurées.
  3. Semi-structuré: Le Big Data semi-structuré, comme vous l’avez peut-être deviné, présente les caractéristiques du Big Data structuré et non structuré. La nature et la représentation de ce type de données ne sont pas complètement arbitraires. Pourtant, il n’est pas non plus suffisamment structuré et organisé pour être utilisé pour une analyse significative. Un exemple serait une page Web qui contient des balises de métadonnées spécifiques (informations supplémentaires qui ne sont pas directement visibles dans le texte), par exemple parce qu’elle contient certains mots clés. Ces balises affichent efficacement des informations spécifiques, telles que l’auteur d’une page ou le moment où elle a été mise en ligne. Le texte lui-même est essentiellement non structuré, mais les mots-clés et autres métadonnées qu’il contient aident à en faire une base d’analyse quelque peu appropriée.

Classification basée sur la source du Big Data

Une autre façon courante de faire la distinction entre différents types de mégadonnées consiste à examiner la source des données. Qui ou quoi a généré l’information? Comme la précédente version, cette méthode de classification comprend également 3 catégories différentes.

  1. Gens: Cette catégorie concerne le big data généré par les personnes. Des exemples seraient des livres, des images, des vidéos ainsi que des informations et des données (personnelles) sur des sites Web et des médias sociaux, tels que Facebook, Twitter, Instagram, etc..
  2. Inscription au processus: Cette catégorie comprend le type plus traditionnel de Big Data, qui est collecté et analysé par les (grandes) entreprises pour améliorer certains processus dans une entreprise.
  3. Machines: Ce type de big data résulte du nombre toujours croissant de capteurs placés dans les machines. Un exemple serait le capteur de chaleur qui est souvent intégré aux processeurs informatiques. Les données générées par les machines peuvent souvent être très complexes, mais au moins ce type de big data est généralement bien structuré et complet.

À quoi peuvent servir les mégadonnées?

Logo FacebookTout ce qui a été discuté jusqu’à présent peut encore sembler quelque peu abstrait. Rendons les choses un peu plus concrètes et discutons de certaines applications réelles du Big Data. Après tout, il existe de très nombreuses façons dont les entreprises et les organisations utilisent les mégadonnées. L’une des premières choses qui me vient à l’esprit est l’énorme quantité de données que les entreprises collectent sur nous. Facebook recueille des données sur tous ses utilisateurs et les analyse pour décider quoi vous montrer sur votre chronologie. Bien sûr, cela est fait pour répondre à vos souhaits et intérêts personnels. Facebook espère que cela vous permettra de rester sur leur site Web pendant de plus longues périodes. À son tour, Amazon recueille des informations sur ses clients et les produits qu’ils achètent. De cette façon, Amazon peut recommander des produits qui vous intéressent et augmenter ainsi ses revenus.

Cependant, les mégadonnées sont également utilisées de manières complètement différentes des stratégies commerciales décrites ci-dessus. Par exemple, les entreprises de transport public peuvent collecter des données sur l’occupation de certains itinéraires. Ensuite, ils pourraient analyser ces données pour décider, par exemple, quels itinéraires nécessitent des bus ou des trains supplémentaires. Un autre cas bien connu d’utilisation efficace des mégadonnées concerne le géant international de la livraison UPS. UPS utilise un logiciel spécial qui a été développé après une analyse des mégadonnées. Ce logiciel aide les conducteurs d’UPS à éviter les virages à gauche, qui sont plus coûteux, plus coûteux et plus dangereux que les virages à droite. Soi-disant, ce système a déjà permis d’économiser des millions de gallons d’UPS en carburant, tout cela grâce au big data.

Un autre exemple intéressant de collecte de mégadonnées est les tests ADN et les sites Web tels que MyHeritage DNA. Ce site Web prétend qu’il peut vous aider à «découvrir vos origines ethniques et à trouver de nouveaux parents» avec un simple test d’ADN. Inutile de dire que ce processus implique beaucoup de collecte de données et de références croisées, ce qui en fait un autre acteur majeur dans la collecte et l’utilisation des mégadonnées. Les tests ADN physiques «traditionnels» impliquent également une énorme quantité de données volumineuses, car les entreprises qui effectuent ces tests obtiendront des ensembles de données extrêmement volumineux pour de très nombreuses personnes. Bien sûr, il est important d’être conscient des risques possibles liés à ces processus de collecte de Big Data. Ces risques seront mis en évidence dans la prochaine partie de cet article.

Le big data est-il dangereux?

Comme indiqué ci-dessus, les mégadonnées peuvent être incroyablement utiles dans de nombreux cas. Il nous fournit des tonnes d’informations que nous pouvons utiliser pour rationaliser les processus et rendre les entreprises plus efficaces et rentables. Cependant, cela ne signifie pas que la collecte et l’utilisation du Big Data sont totalement sans risque. Les mégadonnées comportent cinq risques importants. Nous allons discuter des cinq ici.

Les pirates et les voleurs

Avec tout ce que nous faisons en ligne, il existe un risque inhérent au vol de nos données personnelles et informations sur nos activités Internet. Chaque internaute doit en être conscient. Le nombre de fuites et de vols de données a considérablement augmenté au cours des dernières années. Il y a souvent dans les actualités des histoires de criminels vendant des ensembles de données contenant des mots de passe et d’autres informations sur des endroits comme le dark web. Souvent, ces ensembles de données sont volés sur des sites Web officiels, des entreprises et des organisations. Plus ces ensembles de données sont gros, plus il devient intéressant pour les voleurs d’essayer de les obtenir. S’ils mettent la main sur ces ensembles de données, ils pourraient causer beaucoup de problèmes. Inutile de dire que cela pourrait également compromettre considérablement votre vie privée.

Intimité

La pratique de la collecte de données personnelles est de plus en plus répandue. Cependant, les réglementations actuelles en matière de confidentialité ne peuvent pas suivre l’évolution rapide de la technologie qui rend cette pratique possible. Cela laisse de la place aux zones grises et aux incertitudes qui ne peuvent pas être résolues en examinant la loi. Les problèmes de confidentialité importants qui se posent sont les suivants: Quel type de données peut-on collecter? À propos de qui? Qui devrait avoir accès à ces données?

Lors de la collecte de grandes quantités de données, les chances que des informations personnelles sensibles soient incluses dans ces ensembles de données sont élevées. C’est problématique, même lorsque les pirates et les voleurs ne sont pas en jeu. Après tout, les données sensibles à la vie privée pourraient être utilisées abusivement par toute personne mal intentionnée. Cela inclut les entreprises et organisations (malveillantes).

Mauvaise analyse des données

De nombreuses entreprises et organisations collectent des données volumineuses, car elles peuvent les utiliser pour des analyses intéressantes. Cela pourrait leur donner de nouvelles perspectives importantes sur tout ce qu’ils recherchent (comme, par exemple, les habitudes de consommation). À leur tour, ces idées et conclusions pourraient se traduire par des changements au sein de l’entreprise qui se traduisent par des marges plus élevées et plus de bénéfices. Cependant, comme pour tout autre ensemble de données normal, une analyse incorrecte des mégadonnées peut avoir de graves conséquences. Après tout, une analyse incorrecte peut facilement conduire à des conclusions erronées. Ces mesures peuvent à leur tour se traduire par des mesures inefficaces, voire contre-productives, prises.

Recueillir les «mauvaises» données

Le Big Data devient de plus en plus populaire et les organisations sont de plus en plus disposées à collecter toutes sortes de données. Cela signifie que d’énormes quantités de données sont collectées sans qu’il y ait une raison claire de les analyser. En d’autres termes, il crée une énorme base de données d’informations brutes qui ont été recueillies au cas où. Les entreprises pensent probablement qu’il est assez facile de collecter toutes ces données, elles pourraient donc tout aussi bien le faire. Inutile de dire que ce n’est pas bon pour la vie privée de quiconque. Cela pourrait même conduire à la collecte et à l’analyse de données non pertinentes ou «erronées». Si les conclusions tirées de cette analyse sont utilisées dans la gestion, cela pourrait conduire aux mêmes mesures inefficaces mentionnées dans le paragraphe précédent.

Collecte et sauvegarde de Big Data avec de mauvaises intentions

La collecte de mégadonnées est de plus en plus utilisée par les entreprises, les organisations et les gouvernements afin qu’ils puissent faire des profils individuels précis sur les personnes. Les utilisateurs ou les citoyens ne sont quasiment jamais informés de leurs données personnelles qui sont enregistrées, et encore moins pourquoi et comment. Inutile de dire que cela a de sérieuses implications pour leur confidentialité en ligne. Tout ce qu’ils font en ligne peut être enregistré et consulté plus tard. De plus, les collecteurs de Big Data pourraient facilement influencer et manipuler la prise de décision des gens en analysant et en utilisant les données collectées.

Big data et confidentialité

Smartphone avec photo d'oreilleComme vous le comprendrez probablement déjà, le Big Data comporte de nombreux inconvénients et risques. Néanmoins, de nombreuses entreprises et organisations collectent encore des données à grande échelle, principalement en raison de la façon dont cela peut les aider à croître et à progresser. La collecte de données volumineuses est plus facile que jamais. Cela a d’énormes conséquences pour notre vie privée. Nous avons déjà brièvement évoqué les dangers potentiels pour la vie privée des parties malveillantes qui collectent de mauvaises données. Étant donné que notre vie privée est si étroitement liée à la collecte massive de données personnelles, nous souhaitons utiliser cette section pour discuter des différents problèmes de confidentialité liés aux mégadonnées..

Collecte de données à grande échelle

De nombreuses entreprises, dont Google, Facebook et Twitter, dépendent fortement des publicités pour subvenir à leurs besoins et réaliser des bénéfices. Pour rendre ces publicités aussi efficaces que possible, ces entreprises font des profils détaillés sur leurs utilisateurs, en tenant compte notamment de leurs goûts et intérêts. Il s’agit d’une forme de big data. De même, les gouvernements et les services secrets dépendent également des mégadonnées. Ils utilisent cette grande quantité d’informations pour suivre et enquêter sur les personnes qu’ils jugent suspectes. Bien sûr, cela signifie également qu’il y a beaucoup de données volumineuses à la disposition des cybercriminels et peut-être même des manipulations et des abus. Cela peut créer toutes sortes de problèmes liés à la confidentialité et à l’identité. Celui qui me vient à l’esprit, c’est le vol d’identité.

Pourtant, les possibilités offertes par la collecte dans les bases de données sont bien plus larges que cela. De nos jours, la technologie est devenue si avancée et «intelligente» qu’elle peut combiner des ensembles de données. Cela peut être fait d’une manière si intelligente et astucieuse que les grandes entreprises et organisations en savent probablement plus sur vous que vous! Qui vous êtes, où vous vivez, quels sont vos hobbies, qui sont vos amis: aucune de ces informations ne sera plus privée. Pas une pensée très réconfortante, vous pourriez penser. Heureusement, il existe des moyens de vous protéger contre les atteintes à la vie privée à grande échelle que les mégadonnées peuvent causer..

Lois sur la vie privée

Cookies à l'écranLes lois et réglementations sur la confidentialité peuvent nous protéger contre les atteintes à la vie privée, mais uniquement dans une certaine mesure. Pour compliquer les choses, les lois sur la vie privée diffèrent souvent considérablement entre les différents pays et régions. Par exemple, en Europe, une loi relative à la vie privée des consommateurs, relativement stricte, appelée règlement général sur la protection des données (RGPD) est en vigueur. Cette loi s’applique à tous les États membres de l’UE, bien que les détails puissent différer selon les pays. De nombreuses entreprises internationales ont décidé de se conformer à toutes leurs activités au RGPD. C’est pourquoi Google, par exemple, permet désormais aux utilisateurs de demander la suppression des informations personnelles. Cependant, les lois sur la confidentialité des États-Unis diffèrent d’un État à l’autre et ne protègent pas les consommateurs ainsi que l’UE. Malheureusement, cela est même vrai pour la loi de confidentialité la plus stricte des États-Unis, la California Consumer Privacy Act.

En bref, il n’existe pas de loi «mondiale» stricte sur la confidentialité qui s’applique à tous les collecteurs de Big Data et protège tous les utilisateurs. Cela signifie que notre vie privée n’est pas seulement compromise par les collecteurs de données volumineuses de manière illégale, mais même de manière parfaitement légale, aussi paradoxal que cela puisse paraître. Heureusement, les atteintes à la vie privée à grande échelle révélées par des dénonciateurs comme Edward Snowden et Chelsea Manning ont considérablement accru la sensibilisation aux risques des mégadonnées. Bien sûr, ce n’est qu’une première étape dans l’amélioration des lois actuelles sur la confidentialité.

De nombreux internautes ne sont pas disposés à attendre une amélioration des lois sur la confidentialité – et à juste titre. Ils veulent plutôt agir eux-mêmes en faisant tout ce qu’ils peuvent pour protéger leur vie privée. Voulez-vous également éviter de faire partie d’innombrables ensembles de données volumineux? Il existe plusieurs trucs et astuces pour vous aider sur votre chemin.

Comment éviter que vos données soient enregistrées dans des ensembles de données volumineux

Les ensembles de données volumineux affectent sérieusement votre vie privée et votre sécurité. Ces ensembles de données peuvent contenir toutes sortes d’informations (personnelles), qui pourraient être utilisées abusivement par de grandes entreprises ou même des cybercriminels. C’est pourquoi vous devez toujours vous assurer de laisser le moins de trace en ligne possible. Les conseils suivants peuvent vous aider à y parvenir:

  • Essayez de minimiser l’utilisation de vos informations personnelles lors de la création de mots de passe ou en général sur le Web. Par exemple: évitez d’utiliser votre nom, votre adresse, votre numéro de téléphone, votre date de naissance, etc..
  • Souvenez-vous toujours de ce qui suit: tout ce que vous publiez sur Internet y restera pour toujours. Ce n’est peut-être pas toujours complètement vrai, mais ce niveau de prudence aide à protéger votre vie privée. Vous gérerez automatiquement vos données privées avec plus de soin une fois que vous en serez conscient.
  • Assurez-vous que votre connexion Internet est sécurisée et anonymisée, par exemple en utilisant le navigateur Tor ou un VPN par exemple.
  • Utilisez un ou plusieurs bloqueurs de publicités dans votre navigateur.
  • Utilisez un ou plusieurs plug-ins de navigateur qui bloquent les trackers et les cookies.
  • Videz régulièrement votre cache et supprimez votre historique de navigation et les cookies.
  • Déconnectez-vous des sites Web lorsque vous ne les utilisez pas activement.

Prendre ces mesures est un bon début lorsqu’il s’agit de protéger votre confidentialité et votre sécurité en ligne. Gardez à l’esprit, cependant, que les mégadonnées sont collectées de différentes manières – pas seulement en ligne. En bref, où que vous soyez et quoi que vous fassiez, vous devez toujours être vigilant et essayer de protéger vos données (personnelles) des collecteurs de données volumineuses.

Kim Martin
Kim Martin Administrator
Sorry! The Author has not filled his profile.
follow me