Големи данни и поверителност: Какви са рисковете за поверителност? | VPNOverview

През последните няколко десетилетия светът се промени изключително много в много отношения, особено що се отнася до информационните технологии. Броят на хората, с които можем да общуваме ежедневно, нарасна неимоверно, също като количеството информация, до която имаме достъп. Същото обаче важи и за количеството информация, което големите компании събират за нас. Термини като големи данни се използват все по-често с течение на времето. Но какво точно означава това? Какво са големи данни? Опасно ли е? Как се отразява на нашата поверителност, ако изобщо? Това са някои от въпросите, които ще разгледаме в тази статия.


Какво са големи данни?

Списък с лупаТерминът „големи данни“ описва огромните количества (лични) данни, които непрекъснато се събират от различни участници. Пример може да бъде цялата информация, която Google събира за заявките за търсене на своите потребители. Феноменът на големите данни е сравнително скорошна разработка, която започна, защото (големите) компании и организации, като Facebook, Google и повечето правителства, започнаха да събират все повече данни за своите потребители, клиенти и граждани, отколкото преди. Новите технологии, дигитализираният свят и интернет подпомогнаха изключително много това развитие.

Колекциите от големи данни често са толкова големи, че е невъзможно да се анализират, като се използва традиционен анализ на данни. Ако обаче анализираме големи данни по правилния начин, могат да се предизвикат интересни модели и изводи. Например, големи данни често се използват за широкомащабни пазарни проучвания: кои продукти е най-вероятно да бъдат закупени? Какъв вид реклама е най-ефективна, когато искате да достигнете и убедите клиентите?

За да може даден набор от данни да се счита за големи данни, той обикновено трябва да отговаря на следните три критерия, известни също като 3 v:

  • Сила на звука: Големите данни са всичко друго, но не и малка извадка. Тя включва огромни колекции от данни в резултат на продължително и непрекъснато наблюдение.
  • Скорост: Това е свързано с впечатляващите скорости, с които се събират големи данни. Освен това големите данни често са достъпни в реално време (тъй като се събират).
  • Сорт: Големите набори от данни често съдържат много различни видове информация. Данните в големите масиви от данни могат дори да се комбинират, за да се попълнят всички пропуски и да се направи още по-пълна базата данни.

Освен тези 3 v, големите данни имат някои други характеристики. Например големите данни са чудесни за машинно обучение. Това означава, че може ефективно да се използва за преподаване на компютри и машини на определени задачи. Освен това, както вече сме докоснали накратко, големите данни могат да бъдат използвани за откриване на модели. Това най-вече се случва по много ефективен начин, чрез компютри, работещи върху данните. И накрая, големите данни са отражение на цифровите отпечатъци на потребителите. Това означава, че е страничен продукт от цифровите и онлайн дейности на хората и може да се използва за създаване на индивидуални лични профили.

Различни видове големи данни

Има различни начини за класифициране на големи данни. Първият начин, който се използва най-често, разграничава големите данни въз основа на вида данни, които се събират. Трите възможни категории, използвани за този тип класификация, са: структурирани големи данни, неструктурирани големи данни и полуструктурирани големи данни.

  1. Структуриран: Когато големите данни са структурирани, те могат да бъдат запазвани и представени по организиран и логичен начин, което прави данните по-достъпни и по-лесни за разбиране. Пример може да бъде списък с адреси на клиенти, създадени от компания. В този списък вероятно ще намерите имена, адреси и може би други детайли, като например телефонни номера, всички структурирани ясно, например в диаграма или таблица.
  2. неструктурирани: Неструктурирани големи данни изобщо не се организират. Липсва логично представяне, което би имало смисъл за обикновения човек. Неструктурираните големи данни нямат например структурата на таблица, която обозначава определена съгласуваност между различните елементи от набора от данни. Следователно този вид данни е доста труден за навигация и разбиране. Много набори от данни първоначално започват като неструктурирани големи данни.
  3. Полу-структурирани: Полуструктурирани големи данни, както може би се досещате, има характеристики както на структурирани, така и на неструктурирани големи данни. Естеството и представянето на този тип данни не са напълно произволни. И все пак той не е достатъчно структуриран и организиран, за да бъде използван и за смислен анализ. Пример за това е уеб страница, която съдържа конкретни маркери за метаданни (допълнителна информация, която не се вижда директно в текста), например, защото съдържа определени ключови думи. Тези маркери ефективно показват конкретни битове информация, като например автора на страницата или момента, в който е поставена онлайн. Самият текст е по същество неструктуриран, но ключовите думи и други метаданни, които съдържа, помагат да се превърне в някаква подходяща основа за анализ.

Класификация въз основа на източника на големи данни

Друг често срещан начин за разграничаване на различните видове големи данни е като погледнете източника на данните. Кой или какво е генерирал информацията? Подобно на предишното разделение, този метод на класификация също се състои от 3 различни категории.

  1. хора: Тази категория се отнася до големи данни, генерирани от хора. Примери за това са книги, снимки, видеоклипове, както и информация и (лични) данни в уебсайтове и социални медии, като Facebook, Twitter, Instagram и т.н..
  2. Регистрация на процеса: Тази категория включва по-традиционния вид големи данни, които се събират и анализират от (големите) компании за подобряване на определени процеси в даден бизнес.
  3. Машини: Този тип големи данни са резултат от непрекъснато нарастващия брой сензори, които са поставени в машини. Пример може да бъде топлинният сензор, който често е вграден в компютърни процесори. Данните, генерирани от машини, често могат да бъдат много сложни, но поне този тип големи данни обикновено са добре структурирани и пълни.

За какво могат да се използват големите данни?

Facebook логоВсичко обсъдено досега може да звучи някак абстрактно. Нека направим нещата малко по-конкретни и да обсъдим някои приложения в реалния живот на големи данни. В крайна сметка има много, много начини, по които компаниите и организациите използват големи данни. Едно от първите неща, което ни идва на ум, е огромното количество данни, които компаниите събират около нас. Facebook събира данни за всички свои потребители и анализира това, за да реши какво да ви покаже на вашата времева линия. Разбира се, това се прави, за да се погрижат за вашите лични желания и интереси. Facebook се надява това да ви накара да останете на техния уебсайт за по-дълги периоди от време. От своя страна Amazon събира информация за своите клиенти и продуктите, които купуват. По този начин Amazon може да препоръча продукти, които смятат, че ще се интересувате и ще увеличите приходите си по този начин.

Големите данни обаче се използват и по начини, напълно различни от описаните по-горе търговски стратегии. Например обществените транспортни компании могат да събират данни за натовареността на определени маршрути. След това те биха могли да анализират тези данни, за да решат например кои маршрути изискват допълнителни автобуси или влакове. Друг добре известен случай на ефективна употреба на големи данни се отнася до международния UPS гигант за доставка. UPS използва специален софтуер, който е разработен след анализ на големи данни. Този софтуер помага на драйверите на UPS да избягват завоите вляво, които са по-скъпи, по-разточителни и по-опасни от десните завои. Предполага се, че тази система вече е спестила UPS милиони галони в гориво, всичко това благодарение на големите данни.

Друг интересен пример за събиране на големи данни са ДНК тестове и уебсайтове като MyHeritage DNA. Този уебсайт твърди, че може да ви помогне да „откриете етническия си произход и да намерите нови роднини“ с обикновен ДНК тест. Излишно е да казвам, че този процес включва много събиране на данни и препратки, което го прави друг основен играч в събирането и използването на големи данни. “Традиционните”, физически тестове за ДНК също включват огромно количество големи данни, тъй като компаниите, които провеждат тези тестове, ще получат изключително големи набори от данни за много, много хора. Разбира се, важно е да сте наясно с възможните рискове, които идват при тези процеси за събиране на големи данни. Тези рискове ще бъдат изложени в следващата част на тази статия.

Опасни ли са големите данни?

Както е показано по-горе, големите данни могат да бъдат невероятно полезни в много случаи. Тя ни предоставя тонове информация, която можем да използваме, за да оптимизираме процесите и да направим компаниите по-ефективни и печеливши. Това обаче не означава събирането и използването на големи данни е напълно безрисково. Има пет важни риска, които идват с големи данни. Ще обсъдим всичките пет тук.

Хакери и крадци

С всичко, което правим онлайн, съществува присъщ риск личните ни данни и информация за нашите интернет дейности да бъдат откраднати. Всеки потребител на интернет трябва да е наясно с това. Броят на изтичанията и кражбите на данни се е увеличил драстично през последните няколко години. В новините често има истории за престъпници, които продават набори от данни, съдържащи пароли и друга информация на места като тъмната мрежа. Често тези набори от данни са откраднати от официални уебсайтове, компании и организации. Колкото по-големи са тези набори от данни, толкова по-интересно става за крадците да се опитват да ги получат. Ако попаднат в ръцете на тези набори от данни, те биха могли да създадат много проблеми. Излишно е да казвам, че това също може значително да компрометира личния ви живот.

поверителност

Практиката за събиране на лични данни става все по-широко разпространена. Въпреки това, настоящите разпоредби за поверителност не могат да бъдат в крак с бързото развитие на технологиите, което прави тази практика възможна. Това оставя място за сиви зони и несигурности, които не могат да бъдат решени, ако разгледаме закона. Важните проблеми, свързани с поверителността, които възникват включват: Какъв вид данни е разрешено да се събират? За кого? Кой трябва да има достъп до тези данни?

Когато се събират големи количества данни, шансовете за включване на чувствителна лична информация в тези набори от данни са високи. Това е проблематично, дори когато хакери и крадци не играят. В крайна сметка, чувствителните към поверителност данни могат да бъдат злоупотребявани от всеки с лоши намерения. Това включва (злонамерени) компании и организации.

Лош анализ на данни

Много компании и организации събират големи данни, защото могат да ги използват за интересни анализи. Това може да им даде нови важни поглед върху това, което изследват (като например потребителските навици). От своя страна тези изводи и заключения биха могли да доведат до промени в компанията, които водят до по-високи маржове и повече печалба. Въпреки това, както при всеки друг нормален набор от данни, неправилният анализ на големите данни може да има сериозни последици. В крайна сметка, неправилен анализ може лесно да доведе до грешни изводи. Те от своя страна могат да доведат до неефективни или дори контрапродуктивни мерки, които се предприемат.

Събиране на „грешни“ данни

Големите данни стават все по-популярни и организациите са все по-склонни да събират всякакви данни. Това означава, че се събират гигантски количества данни, без да има ясна причина за анализа им. С други думи, той създава огромна база данни със сурова информация, която е събрана за всеки случай. Фирмите вероятно смятат, че е достатъчно лесно да се съберат всички тези данни, така че може и да го направят. Излишно е да казвам, че това не е добре за нечий личен живот. Това дори може да доведе до събиране и анализиране на неподходящи или „грешни“ данни. Ако изводите, направени от този анализ, се използват в управлението, това може да доведе до същите неефективни мерки, споменати в предходния параграф.

Събиране и запазване на големи данни с лоши намерения

Събирането на големи данни се използва все по-често от компании, организации и правителства, за да могат да правят точни индивидуални профили на хората. Потребителите или гражданите почти никога не са уведомявани за това коя от личните им данни се регистрира, камо ли защо и как. Излишно е да казвам, че това има сериозни последици за онлайн поверителността им. Всичко, което правят онлайн, може да бъде запазено и прегледано по-късно. Освен това големите колекционери на данни могат лесно да повлияят и да манипулират вземането на решения на хората чрез анализ и използване на събраните данни.

Големи данни и поверителност

Смартфон със снимка на ухотоКакто вероятно ще разберете до сега, големите данни идват с много недостатъци и рискове. Въпреки това много компании и организации все още събират данни в огромен мащаб, най-вече заради това как може да им помогне да се развиват и да напредват. Събирането на големи данни е по-лесно от всякога. Това има огромни последици за нашата поверителност. Вече накратко обсъдихме възможните опасности за поверителността на злонамерени страни, които събират лоши данни. Тъй като нашата поверителност е толкова тясно обвързана с масовото събиране на лични данни, ние искаме да използваме този раздел за обсъждане на различните проблеми, свързани с поверителността, които идват с големи данни.

Събиране на данни в голям мащаб

Много компании, включително Google, Facebook и Twitter, са силно зависими от рекламите, за да се поддържат и да печелят. За да направят тези реклами възможно най-ефективни, тези компании правят подробни профили на своите потребители, особено като вземат предвид техните харесвания и интереси. Това е форма на големи данни. По същия начин правителствата и тайните служби също зависят от големите данни. Те използват това огромно количество информация за проследяване и разследване на хора, които смятат за подозрителни. Разбира се, това също означава, че има много големи данни за киберпрестъпниците, които могат да се хванат и дори да манипулират и злоупотребяват. Това може да създаде всякакви проблеми с поверителността и идентичността. Това, което идва на ум, е кражба на идентичност.

Все пак възможностите, които идват със събирането в базите данни, са много по-широки от тези. Днес технологията стана толкова напреднала и „умна“, че може да комбинира набори от данни. Това може да се направи по толкова умен и хитър начин, че големите корпорации и организации вероятно знаят повече за вас, отколкото вие! Кой сте, къде живеете, какви са вашите хобита, кои са вашите приятели: никоя от тази информация вече няма да бъде частна. Не е много успокояваща мисъл, може да си помислите. За щастие, има някои начини да се предпазите от широкомащабното нарушаване на поверителността на големите данни.

Закони за поверителност

Бисквитки на екранаЗаконите и разпоредбите за поверителност могат да ни предпазят от нарушаване на поверителността, но само до известна степен. За да се усложнят нещата, законите за поверителност често се различават значително в различните страни и региони. Например в Европа е в сила сравнително строг закон за поверителност на потребителите, наречен Общ регламент за защита на данните (GDPR). Този закон се прилага за всички държави-членки на ЕС, въпреки че детайлите могат да се различават за всяка държава. Много международни компании са решили да спазват целия си бизнес пред GDPR. Ето защо Google например позволява на потребителите да поискат изтриване на лична информация. Въпреки това законите за поверителност в Съединените щати се различават от държавата до държавата и не защитават потребителите, както и ЕС. За съжаление, това важи дори за най-строгия закон за поверителност в САЩ, Калифорнийския закон за поверителност на потребителите.

Накратко, няма такова нещо като силен „глобален“ закон за поверителност, който да се прилага за всички големи колекционери на данни и да защитава всички потребители. Това означава, че нашата неприкосновеност на личния живот не се накърнява само от големите събирачи на данни по незаконен, но дори и по напълно легални начини, колкото и парадоксално да звучи това. За щастие, мащабните нарушения на поверителността, изложени от свиркачи като Едуард Сноудън и Челси Манинг, значително повишиха осведомеността за рисковете от големи данни. Разбира се, това е само първа стъпка към подобряване на действащите закони за поверителност.

Много потребители на интернет не са готови да очакват подобрение на законите за поверителност – и с право. По-скоро те искат сами да предприемат действия, като правят всичко възможно, за да защитят личния си живот. Искате ли да избегнете и част от безброй големи масиви от данни? Има няколко съвета и трика, които да ви помогнат по пътя ви.

Как да запазите данните си да бъдат запазвани в големи масиви от данни

Големите набори от данни сериозно се отразяват на вашата поверителност и сигурност. Тези набори от данни могат да съдържат всякакъв вид (лична) информация, която може да бъде злоупотребена от големи компании или дори киберпрестъпници. Ето защо винаги трябва да се уверите, че оставяте възможно най-малко следа в интернет. Следните съвети могат да ви помогнат да постигнете това:

  • Опитайте се да сведете до минимум използването на вашата лична информация при създаване на пароли или като цяло в мрежата. Например: избягвайте да използвате вашето име, адрес, телефонен номер, дата на раждане и т.н..
  • Винаги помнете следното: всичко, което публикувате в интернет, ще бъде там завинаги. Това може не винаги да е напълно вярно, но това ниво на предпазливост наистина помага да се запази вашата поверителност. Вие автоматично ще обработвате личните си данни с по-голямо внимание, след като знаете за този факт.
  • Уверете се, че вашата интернет връзка е защитена и анонимна, например като използвате браузъра Tor или VPN например.
  • Използвайте един или няколко рекламни блокера във вашия браузър.
  • Използвайте или повече приставки за браузър, които блокират тракери и бисквитки.
  • Редовно изчиствайте кеша си и изтривайте историята на сърфирането и бисквитките.
  • Излезте от уебсайтове, когато не ги използвате активно.

Предприемането на тези стъпки е добро начало, когато става дума за запазване на вашата онлайн поверителност и сигурност. Имайте предвид обаче, че големите данни се събират по много различни начини – не само онлайн. Накратко, където и да се занимавате, винаги трябва да сте бдителни и да се опитвате да защитите вашите (лични) данни от големи колектори на данни.

Kim Martin
Kim Martin Administrator
Sorry! The Author has not filled his profile.
follow me