Date mari și confidențialitate: Care sunt riscurile confidențialității? | VPNOverview

În ultimele decenii, lumea s-a schimbat enorm în multe privințe, mai ales când vine vorba de IT. Numărul de persoane cu care putem comunica zilnic a crescut enorm, la fel ca și cantitatea de informații la care avem acces. Totuși, același lucru este valabil și pentru informațiile pe care companiile mari le colectează despre noi. Termenii, cum ar fi datele mari, sunt utilizate mai des pe măsură ce trece timpul. Dar ce înseamnă asta exact? Ce este datele mari? E periculos? Cum ne afectează confidențialitatea, dacă este deloc? Acestea sunt câteva dintre întrebările pe care le vom adresa în acest articol.


Ce este mare date?

Lista cu lupaTermenul „date mari” descrie cantitățile enorme de date (personale) care sunt colectate continuu de diverși actori. Un exemplu ar fi toate informațiile pe care Google le adună despre întrebările de căutare ale utilizatorilor săi. Fenomenul datelor mari este o dezvoltare relativ recentă, care a început, deoarece companii și organizații (mari), precum Facebook, Google și majoritatea guvernelor, au început să strângă tot mai multe date despre utilizatorii, clienții și cetățenii săi decât înainte. Noile tehnologii, o lume digitalizată și internetul au ajutat la această dezvoltare imensă.

Colecțiile de date mari sunt adesea atât de vaste încât este imposibil să le analizezi folosind analiza tradițională a datelor. Cu toate acestea, dacă se analizează datele mari în mod corect, pot fi induse tipare și concluzii interesante. De exemplu, datele mari sunt deseori utilizate pentru cercetarea de piață la scară largă: ce produse sunt cel mai probabil să fie achiziționate? Ce fel de publicitate este cea mai eficientă atunci când doriți să ajungeți și să convingeți clienții?

Pentru ca un set de date să fie considerat date mari, ar trebui să îndeplinească de obicei următoarele trei criterii, cunoscute și sub denumirea de ” 3 v’s:

  • Volum: Datele mari sunt orice altceva decât un eșantion mic. Aceasta implică colecții vaste de date, rezultate din observații lungi și continue.
  • Viteză: Aceasta are legătură cu vitezele impresionante la care se colectează date mari. Mai mult decât atât, datele mari sunt adesea accesibile în timp real (deoarece sunt colectate).
  • Varietate: Seturile de date mari conțin adesea multe tipuri diferite de informații. Datele din seturile mari de date ar putea fi chiar combinate pentru a completa orice lacune și a face setul de date și mai complet.

În afară de aceste 3 versiuni, datele mari au alte caracteristici. De exemplu, datele mari sunt excelente pentru învățarea mașinii. Acest lucru înseamnă că poate fi utilizat eficient pentru a preda calculatoarelor și mașinilor anumite sarcini. În plus, așa cum am fost deja pe scurt, datele mari pot fi folosite pentru a detecta tiparele. Acest lucru se întâmplă mai ales într-un mod foarte eficient, prin intermediul calculatoarelor care lucrează la date. În sfârșit, datele mari reprezintă reflecția amprentelor digitale ale utilizatorilor. Acest lucru înseamnă că este un produs secundar al activităților digitale și online ale oamenilor și poate fi folosit pentru a crea profiluri personale individuale.

Diferite tipuri de date mari

Există diferite modalități de clasificare a datelor mari. Prima modalitate, care este utilizată cel mai frecvent, diferențiază datele mari în funcție de tipul de date care sunt colectate. Cele trei categorii posibile utilizate pentru acest tip de clasificare sunt: ​​date mari structurate, date mari nestructurate și date mari semi-structurate.

  1. structurat: Când datele mari sunt structurate, acestea pot fi salvate și prezentate într-un mod organizat și logic, făcând datele mai accesibile și mai ușor de înțeles. Un exemplu ar fi o listă de adrese ale clienților create de o companie. În această listă, probabil că se vor găsi numele, adresele și poate alte detalii ale clienților, cum ar fi numere de telefon, toate structurate clar într-un grafic sau tabel.
  2. nestructurată: Datele mari nestructurate nu sunt deloc organizate. Îi lipsește o prezentare logică care ar avea sens pentru ființa umană obișnuită. Datele mari nestructurate nu au structura, de exemplu, a unui tabel care denotă o anumită coerență între diferitele elemente ale setului de date. Prin urmare, acest tip de date este destul de dificil de navigat și de înțeles. Multe seturi de date încep inițial ca date mari nestructurate.
  3. Semi-structurat: Datele mari semi-structurate, așa cum ați putea ghici, au caracteristici ale datelor mari structurate și nestructurate. Natura și reprezentarea acestui tip de date nu sunt complet arbitrare. Totuși, nu este structurat și organizat suficient încât să fie utilizat pentru o analiză semnificativă. Un exemplu ar fi o pagină web care conține etichete meta date specifice (informații suplimentare care nu sunt direct vizibile în text), de exemplu, deoarece conține anumite cuvinte cheie. Aceste etichete arată în mod eficient biți de informații specifice, cum ar fi autorul unei pagini sau momentul în care a fost plasată online. Textul în sine este esențial nestructurat, însă cuvintele cheie și alte meta-date pe care le conține ajută la transformarea acestuia într-o bază oarecum potrivită pentru analiză.

Clasificare bazată pe sursa de date mari

Un alt mod obișnuit de a face diferența între diferite tipuri de date mari este examinarea sursei datelor. Cine sau ce a generat informația? Ca și versiunea precedentă, această metodă de clasificare constă, de asemenea, din 3 categorii diferite.

  1. oameni: Această categorie se referă la date mari generate de oameni. Exemple ar fi cărți, imagini, videoclipuri, precum și informații și date (personale) pe site-uri web și social media, cum ar fi Facebook, Twitter, Instagram, etc..
  2. Înregistrarea proceselor: Această categorie include tipul mai tradițional de date mari, care sunt colectate și analizate de către companiile (mari) pentru a îmbunătăți anumite procese dintr-o afacere.
  3. Mașini: Acest tip de date mari rezultă din numărul tot mai mare de senzori care sunt plasați în mașini. Un exemplu ar fi senzorul de căldură care este adesea încorporat în procesoarele de calculator. Datele generate de mașini pot fi adesea foarte complexe, dar cel puțin acest tip de date mari este, în general, bine structurat și complet.

La ce se pot folosi datele mari?

Logo-ul FacebookTot ceea ce s-a discutat până acum ar putea suna oarecum abstract. Să facem lucrurile un pic mai concrete și să discutăm unele aplicații din viața reală a datelor mari. La urma urmei, există multe, multe moduri în care companiile și organizațiile folosesc date mari. Unul dintre primele lucruri care îmi vin în minte este cantitățile enorme de companii de date care adună despre noi. Facebook colectează date despre toți utilizatorii săi și analizează acest lucru pentru a decide ce să-ți arate pe cronologia ta. Desigur, acest lucru este făcut pentru a satisface dorințele și interesele dvs. personale. Facebook speră că acest lucru vă va face să rămâneți pe site-ul lor web pentru perioade mai lungi de timp. La rândul său, Amazon adună informații despre clienții săi și produsele pe care le cumpără. În acest fel, Amazon vă poate recomanda produsele în care consideră că veți fi interesat și le va crește câștigurile în acest fel.

Cu toate acestea, datele mari sunt utilizate și în moduri complet diferite de strategiile comerciale descrise mai sus. De exemplu, companiile de transport public pot strânge date despre cât de ocupate sunt anumite rute. Ulterior, aceștia ar putea analiza aceste date pentru a decide, de exemplu, ce rute necesită autobuze sau trenuri suplimentare. Un alt caz binecunoscut de utilizare eficientă a datelor mari privește UPS-ul gigant al livrărilor internaționale. UPS folosește un software special care a fost dezvoltat după analize mari de date. Acest software ajută șoferii UPS să evite virajele din stânga, care sunt mai costisitoare, mai risipitoare și mai periculoase decât virajele din dreapta. Se presupune că acest sistem a economisit deja UPS milioane de galoane în combustibil, totul datorită datelor mari.

Un alt exemplu interesant de colectare a datelor mari sunt testele ADN și site-urile web, cum ar fi ADN-ul MyHeritage. Acest site web susține că vă poate ajuta „să vă descoperiți originile etnice și să găsiți rude noi” cu un simplu test ADN. Inutil să spun, acest proces implică o mulțime de culegere de date și de referință încrucișată, ceea ce îl face un alt jucător important în colectarea și utilizarea datelor mari. Testele ADN fizice „tradiționale” implică, de asemenea, o cantitate foarte mare de date mari, deoarece companiile care efectuează aceste teste vor câștiga seturi de date extrem de mari despre multe, multe persoane. Desigur, este important să fim conștienți de riscurile posibile care apar cu aceste procese de colectare a datelor. Aceste riscuri vor fi evidențiate în următoarea parte a acestui articol.

Datele mari sunt periculoase?

După cum se arată mai sus, datele mari pot fi incredibil de utile în multe cazuri. Ne oferă tone de informații pe care le putem utiliza pentru a eficientiza procesele și a face companiile mai eficiente și mai profitabile. Totuși, acest lucru nu înseamnă că colectarea și utilizarea datelor mari nu este complet lipsită de riscuri. Există cinci riscuri importante care vin cu date mari. Vom discuta toate cele cinci aici.

Hackerii și hoții

Cu tot ceea ce facem online, există riscul inerent ca datele noastre personale și informațiile din activitățile noastre de internet să fie furate. Fiecare utilizator de internet trebuie să fie conștient de acest lucru. Numărul de scurgeri de date și furturi a crescut drastic în ultimii ani. De multe ori există știri în știrile despre infractorii care vând seturi de date care conțin parole și alte informații pe locuri precum web-ul întunecat. Adesea, aceste seturi de date sunt furate de pe site-urile web oficiale, companii și organizații. Cu cât aceste seturi de date sunt mai mari, cu atât este mai interesant ca hoții să încerce să le obțină. Dacă pun mâna pe aceste seturi de date, ar putea cauza multe probleme. Inutil să spun, acest lucru ar putea compromite în mare măsură confidențialitatea.

intimitate

Practica de culegere a datelor cu caracter personal este din ce în ce mai răspândită. Cu toate acestea, reglementările actuale de confidențialitate nu pot fi în pas cu evoluțiile rapide ale tehnologiei care fac posibilă această practică. Acest lucru lasă spațiu pentru zone cenușii și incertitudini care nu pot fi rezolvate prin examinarea legii. Printre principalele probleme de confidențialitate care apar sunt: ​​Ce fel de date sunt permise să fie colectate? Despre cine? Cine ar trebui să aibă acces la aceste date?

Atunci când colectați cantități mari de date, șansele ca informațiile personale sensibile să fie incluse în aceste seturi de date sunt mari. Acest lucru este problematic, chiar și atunci când hackerii și hoții nu sunt în joc. La urma urmei, datele sensibile la confidențialitate ar putea fi abuzate de oricine are intenții rele. Aceasta include companii și organizații (rău intenționate).

Analiza slabă a datelor

Multe companii și organizații colectează date mari, deoarece le pot folosi pentru analize interesante. Acest lucru le-ar putea oferi informații importante noi cu privire la orice cercetează (cum ar fi, de exemplu, obiceiurile consumatorilor). La rândul lor, aceste informații și concluzii s-ar putea traduce în schimbări în cadrul companiei care au ca rezultat marje mai mari și mai mult profit. Cu toate acestea, la fel ca în orice alt set de date normal, o analiză incorectă a datelor mari poate avea consecințe grave. La urma urmei, o analiză necorespunzătoare poate duce cu ușurință la concluzii greșite. La rândul lor, acestea se pot traduce prin luarea de măsuri ineficiente sau chiar contraproductive.

Adunarea datelor „greșite”

Datele mari devin din ce în ce mai populare, iar organizațiile sunt din ce în ce mai dispuse să colecteze tot felul de date. Aceasta înseamnă că se colectează cantități gigantice de date fără a exista un motiv clar pentru analizarea acestora. Cu alte cuvinte, creează o bază de date uriașă de informații brute, care au fost adunate în caz. Este probabil ca companiile să creadă că este destul de ușor să adune toate aceste date, așa că la fel de bine ar putea face. Inutil să spun, acest lucru nu este bine pentru confidențialitatea oricui. Ar putea duce chiar la culegerea și analizarea datelor irelevante sau „greșite”. Dacă concluziile obținute din această analiză sunt utilizate în management, aceasta ar putea duce la aceleași măsuri ineficiente menționate la paragraful anterior.

Colectarea și salvarea datelor mari cu intenții rele

Colecția de date mari este folosită din ce în ce mai des de companii, organizații și guverne, astfel încât acestea să poată realiza profiluri individuale exacte pe oameni. Utilizatorii sau cetățenii sunt cu greu notificați care dintre datele lor personale sunt înregistrate, cu atât mai puțin de ce și cum. Inutil să spun, acest lucru are implicații serioase pentru confidențialitatea lor online. Tot ceea ce fac online, poate fi salvat și vizualizat mai târziu. Mai mult, colectorii de date mari ar putea influența și manipula cu ușurință luarea deciziilor oamenilor prin analizarea și utilizarea datelor colectate.

Date mari și confidențialitate

Smartphone cu imagine de urecheDupă cum probabil veți înțelege până acum, datele mari vin cu multe dezavantaje și riscuri. Cu toate acestea, multe companii și organizații colectează în continuare date la scară uriașă, mai ales datorită modului în care le poate ajuta să crească și să avanseze. Colectarea de date mari este mai ușoară ca niciodată. Acest lucru are consecințe uriașe asupra vieții private. Am discutat deja pe scurt posibilele pericole în confidențialitate ale părților rău intenționate care colectează date proaste. Întrucât confidențialitatea noastră este atât de strâns legată de colectarea în masă a datelor cu caracter personal, dorim să utilizăm această secțiune pentru a discuta despre diferitele probleme de confidențialitate care vin cu date mari.

Colectare de date la scară largă

O mulțime de companii, inclusiv Google, Facebook și Twitter, depind în mare măsură de reclame pentru a se menține și pentru a obține un profit. Pentru ca aceste reclame să fie cât mai eficiente, aceste companii realizează profiluri detaliate despre utilizatorii lor, ținând cont în special de like-urile și interesele lor. Aceasta este o formă de date mari. De asemenea, guvernele și serviciile secrete depind și de date mari. Ei folosesc această cantitate vastă de informații pentru a urmări și cerceta persoane pe care le consideră suspecte. Desigur, acest lucru înseamnă, de asemenea, că există o mulțime de date importante pentru ca infractorii cibernetici să pună mâna pe ei și poate chiar să manipuleze și să abuzeze. Aceasta poate crea tot felul de confidențialitate și probleme legate de identitate. Unul care îmi vine în minte, este furtul de identitate.

Totuși, posibilitățile care vin cu colecția în bazele de date sunt mult mai ample decât aceasta. În aceste zile, tehnologia a devenit atât de avansată și de „inteligentă” încât poate combina seturi de date. Acest lucru se poate realiza într-un mod atât de inteligent și priceput, încât marile corporații și organizații știu mai multe despre tine decât tu! Cine ești, unde locuiești, care sunt hobby-urile tale, cine sunt prietenii tăi: niciuna din aceste informații nu va mai fi privată. Nu este un gând foarte reconfortant, s-ar putea să gândești. Din fericire, există câteva modalități de a vă proteja de încălcarea vieții mari la scară mare pe care le pot provoca date mari.

Legile privind confidențialitatea

Cookie-uri pe ecranLegile și reglementările privind confidențialitatea ne pot proteja împotriva încălcării vieții private, dar numai într-o anumită măsură. Pentru a complica problemele, legile de confidențialitate diferă adesea foarte mult între diferite țări și regiuni. De exemplu, în Europa este în vigoare o lege relativ strictă a confidențialității consumatorilor, denumită Regulamentul general privind protecția datelor (GDPR). Această lege se aplică tuturor statelor membre ale UE, deși detaliile pot diferi în funcție de fiecare țară. Multe companii internaționale au decis să respecte toate afacerile lor la GDPR. Acesta este motivul pentru care Google, de exemplu, permite acum utilizatorilor să solicite ștergerea informațiilor personale. Cu toate acestea, legile privind confidențialitatea din Statele Unite diferă de la stat la stat și nu protejează consumatorii, precum și UE. Din păcate, acest lucru este valabil chiar și pentru cea mai grea lege de confidențialitate din SUA, California California Privacy Privacy Act.

Pe scurt, nu există o lege puternică de confidențialitate „globală”, care se aplică tuturor colectorilor de date mari și protejează toți utilizatorii. Aceasta înseamnă că confidențialitatea noastră nu este doar vătămată de colecționarii mari de date în mod ilegal, ci chiar și în moduri perfect legale, la fel de paradoxale pe cât poate părea acest lucru. Din fericire, încălcările de confidențialitate pe scară largă expuse de fluierători precum Edward Snowden și Chelsea Manning au sporit gradul de conștientizare pentru riscurile datelor mari. Desigur, acesta este doar un prim pas în îmbunătățirea legilor de confidențialitate actuale.

Mulți internauți nu sunt dispuși să aștepte o îmbunătățire a legilor privind confidențialitatea – și pe bună dreptate. Mai degrabă, vor să acționeze ei înșiși făcând tot ce pot pentru a-și proteja intimitatea. Doriți să evitați să faceți parte și din nenumărate seturi de date mari? Există mai multe sfaturi și trucuri care să vă ajute în drum.

Cum să nu vă salvați datele în seturi mari de date

Seturile de date mari afectează în mod serios confidențialitatea și securitatea. Aceste seturi de date pot conține tot felul de informații (personale), care ar putea fi abuzate de companii mari sau chiar de infractorii cibernetici. Acesta este motivul pentru care ar trebui să vă asigurați întotdeauna să lăsați cât mai puțin de urmă online. Următoarele sfaturi vă pot ajuta să realizați acest lucru:

  • Încercați să minimizați utilizarea informațiilor dvs. personale atunci când creați parole sau, în general, pe web. De exemplu: evitați să folosiți numele, adresa, numărul de telefon, data nașterii și așa mai departe.
  • Amintiți-vă întotdeauna de următoarele: tot ceea ce publicați pe internet, va fi acolo pentru totdeauna. Acest lucru nu poate fi întotdeauna complet adevărat, dar acest nivel de precauție vă ajută să vă protejați confidențialitatea. Vă veți gestiona automat datele private cu mai multă grijă după ce veți avea cunoștință de acest fapt.
  • Asigurați-vă că conexiunea la internet este sigură și anonimizată, de exemplu, folosind browserul Tor sau de exemplu un VPN.
  • Utilizați unul sau mai multe blocante publicitare în browser.
  • Utilizați pe sau mai multe pluginuri pentru browser care blochează trackerele și cookie-urile.
  • Ștergeți-vă în mod regulat memoria cache și ștergeți istoricul de navigare și cookie-urile.
  • Deconectați-vă de site-uri web când nu le utilizați în mod activ.

Efectuarea acestor pași este un bun început atunci când vine vorba de protejarea confidențialității și securității online. Rețineți, însă, că datele mari sunt colectate în mai multe moduri diferite – nu doar online. Pe scurt, oriunde te-ai afla și orice ai face, ar trebui să fii mereu vigilent și să încerci să îți protejezi datele (personale) de colecționarii de date mari.

Kim Martin Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map