Великі дані та конфіденційність: Які ризики конфіденційності? | VPNOперегляд

За останні кілька десятиліть світ багато в чому змінився, особливо коли йдеться про ІТ. Кількість людей, з якими ми можемо спілкуватися щодня, зросла надзвичайно, як і кількість інформації, до якої ми маємо доступ. Однак те саме стосується кількості інформації, яку збирають про нас великі компанії. Такі терміни, як великі дані, використовуються все частіше з часом. Але що це означає саме? Що таке великі дані? Це небезпечно? Як це впливає на нашу конфіденційність, якщо взагалі? Це деякі питання, які ми розкриємо в цій статті.


Що таке великі дані?

Список з лупоюТермін “великі дані” описує величезну кількість (особистих) даних, які постійно збираються різними суб’єктами. Прикладом може бути вся інформація, яку Google збирає про пошукові запити своїх користувачів. Явище великих даних – це порівняно недавня подія, яка розпочалася тому, що (великі) компанії та організації, такі як Facebook, Google та більшість урядів, почали збирати більше даних про своїх користувачів, клієнтів та громадян, ніж раніше. Нові технології, оцифрований світ та Інтернет дуже допомогли цьому розвитку.

Колекції великих даних часто настільки великі, що неможливо проаналізувати їх за допомогою традиційного аналізу даних. Однак, якщо правильно аналізувати великі дані, можна викликати цікаві зразки та висновки. Наприклад, великі дані часто використовуються для широкомасштабних досліджень ринку: яку продукцію найімовірніше придбати? Яка реклама є найбільш ефективною, коли ви хочете охопити клієнтів та переконати їх?

Для того, щоб набір даних вважався великими даними, він, як правило, повинен відповідати трьом наступним критеріям, також відомим як 3 v:

  • Обсяг: Великі дані – це все, окрім невеликої вибірки. Він включає великі набори даних, отримані в результаті тривалого безперервного спостереження.
  • Швидкість: Це пов’язано з вражаючою швидкістю, з якою збираються великі дані. Більше того, великі дані часто доступні в режимі реального часу (коли вони збираються).
  • Різноманітність: Великі набори даних часто містять багато різних типів інформації. Дані в великих наборах даних можна навіть комбінувати, щоб заповнити будь-які прогалини і зробити набір даних ще більш повним.

Окрім цих трьох версій, великі дані мають деякі інші характеристики. Наприклад, великі дані чудово підходять для машинного навчання. Це означає, що його можна ефективно використовувати для навчання комп’ютерів та машин певним завданням. Крім того, як ми вже коротко торкалися, великі дані можуть бути використані для виявлення шаблонів. Здебільшого це відбувається дуже ефективно, за допомогою комп’ютерів, що працюють над даними. Нарешті, великі дані – це відображення цифрових відбитків користувачів. Це означає, що він є побічним продуктом цифрових та онлайн-активностей людей і може використовуватися для створення індивідуальних особистих профілів.

Різні види великих даних

Існують різні способи класифікації великих даних. Перший спосіб, який використовується найчастіше, відрізняє великі дані на основі виду даних, які збираються. Три класифіковані категорії, що використовуються для цього типу класифікації: структуровані великі дані, неструктуровані великі дані та напівструктуровані великі дані.

  1. Структурований: Коли великі дані структуровані, їх можна зберігати та представляти організовано та логічно, роблячи дані більш доступними та легшими для розуміння. Прикладом може бути список адрес клієнтів, створених компанією. У цьому списку ви, ймовірно, знайдете імена, адреси та, можливо, інші реквізити, такі як телефонні номери, всі чітко структуровані, наприклад, у діаграмі чи таблиці.
  2. Неструктурований: Неструктуровані великі дані взагалі не організовані. Не вистачає логічного викладу, який мав би сенс для пересічної людини. Неструктуровані великі дані не мають структури, наприклад, таблиці, яка позначає певну узгодженість між різними елементами набору даних. Отже, цей тип даних досить важко орієнтуватися та розуміти. Багато наборів даних спочатку починаються як неструктуровані великі дані.
  3. Напівструктуровані: Напівструктуровані великі дані, як ви могли здогадатися, мають характеристики як структурованих, так і неструктурованих великих даних. Характер та представлення цього типу даних не є абсолютно довільними. Однак він також недостатньо структурований і організований для того, щоб використовувати його для змістовного аналізу. Прикладом може бути веб-сторінка, яка містить конкретні теги метаданих (додаткова інформація, яка безпосередньо не видно в тексті), наприклад, тому що вона містить певні ключові слова. Ці теги ефективно показують конкретні шматочки інформації, наприклад, автора сторінки чи моменту її розміщення в Інтернеті. Сам текст по суті неструктурований, але ключові слова та інші метадані, які він містить, допомагають зробити його дещо придатною основою для аналізу.

Класифікація на основі джерела великих даних

Ще один поширений спосіб розрізнити різні види великих даних – перегляньте джерело даних. Хто або що створив інформацію? Як і в попередньому розділі, цей метод класифікації також складається з 3 різних категорій.

  1. Люди: Ця категорія стосується великих даних, створених людьми. Прикладами можуть бути книги, зображення, відео, а також інформація та (особисті) дані на веб-сайтах та соціальних мережах, таких як Facebook, Twitter, Instagram тощо..
  2. Реєстрація процесу: Ця категорія включає більш традиційний вид великих даних, який збирають та аналізують (великі) компанії для покращення певних процесів у бізнесі.
  3. Машини: Цей тип великих даних є результатом постійно зростаючої кількості датчиків, розміщених у машинах. Прикладом може бути датчик тепла, який часто вбудовується в комп’ютерні процесори. Дані, що генеруються машинами, часто можуть бути дуже складними, але принаймні цей тип великих даних, як правило, добре структурований і повний.

Для чого можуть використовуватися великі дані?

Логотип FacebookВсе обговорене дотепер може здатися дещо абстрактним. Давайте зробимо все трохи конкретніше та обговоримо деякі реальні програми великих даних. Адже існує багато, багато способів, якими компанії та організації використовують великі дані. Одне з перших, що спадає на думку, – це величезна кількість даних, про які збираються компанії. Facebook збирає дані про всіх своїх користувачів і аналізує це, щоб вирішити, що показати на вашій хронології. Звичайно, це робиться для задоволення ваших особистих побажань та інтересів. Facebook сподівається, що завдяки цьому ви зможете залишатися на їхньому веб-сайті довше. У свою чергу, Amazon збирає інформацію про своїх клієнтів та продукти, які вони купують. Таким чином, Amazon може рекомендувати продукти, які, на їх думку, вам зацікавлять, і таким чином збільшувати їхній прибуток.

Однак великі дані також використовуються способами, абсолютно відмінними від комерційних стратегій, описаних вище. Наприклад, компанії громадського транспорту можуть збирати дані про зайнятість певних маршрутів. Після цього вони могли проаналізувати ці дані, щоб вирішити, наприклад, які маршрути потребують додаткових автобусів чи поїздів. Ще один відомий випадок ефективного використання великих даних стосується міжнародного постачальника гігантських ІБП. UPS використовує спеціальне програмне забезпечення, яке було розроблено після аналізу великих даних. Це програмне забезпечення допомагає водіям ДБЖ уникати поворотів ліворуч, які коштують дорожче, марно і небезпечніше, ніж правий поворот. Імовірно, ця система вже заощадила UPS мільйони галонів на паливі, і все це завдяки великим даним.

Ще одним цікавим прикладом збору великих даних є тести ДНК та веб-сайти, такі як MyHeritage DNA. Цей веб-сайт стверджує, що він може допомогти вам «розкрити етнічне походження та знайти нових родичів» простим тестом на ДНК. Потрібно говорити, що цей процес включає багато збору даних та перехресних посилань, що робить його ще одним головним гравцем у зборі та використанні великих даних. “Традиційні”, фізичні тести на ДНК також передбачають величезну кількість великих даних, оскільки компанії, які проводять ці тести, отримають надзвичайно великі набори даних про багатьох, багатьох людей. Звичайно, важливо усвідомлювати можливі ризики, пов’язані з цими процесами збору великих даних. Ці ризики будуть висвітлені в наступній частині цієї статті.

Чи великі дані небезпечні?

Як показано вище, великі дані можуть бути неймовірно корисними у багатьох випадках. Він надає нам багато інформації, яку ми можемо використати для впорядкування процесів та зробити компанії більш ефективними та прибутковими. Однак це не означає, що збір та використання великих даних є абсолютно безризиковими. Існує п’ять важливих ризиків, які пов’язані з великими даними. Ми обговоримо всі п’ять тут.

Хакери та злодії

У всьому, що ми робимо в Інтернеті, існує вроджений ризик того, що наші особисті дані та інформація про нашу Інтернет-діяльність можуть бути викрадені. Кожен користувач Інтернету повинен знати про це. Кількість витоків та крадіжок даних різко зросла за останні кілька років. У новинах часто зустрічаються історії про злочинців, які продають набори даних, що містять паролі та іншу інформацію в таких місцях, як темна павутина. Часто ці набори даних викрадаються з офіційних веб-сайтів, компаній та організацій. Чим більше цих наборів даних, тим цікавішим стає злодіям, які намагаються їх отримати. Якщо вони потраплять на ці набори даних, вони можуть спричинити багато проблем. Зайве говорити, що це також може сильно пошкодити вашу конфіденційність.

Конфіденційність

Практика збору персональних даних набуває все більшого поширення. Однак діючі норми конфіденційності не можуть бути в курсі стрімкого розвитку технологій, що робить цю практику можливою. Це залишає простір для сірих областей та невизначеностей, які неможливо вирішити, переглянувши закон. Важливі проблеми конфіденційності, які виникають, включають: Які дані дозволяється збирати? Про кого? Хто повинен мати доступ до цих даних?

Під час збору великої кількості даних шанси на включення в ці набори даних чутливої ​​особистої інформації високі. Це проблематично, навіть коли хакери та злодії не грають. Зрештою, конфіденційними даними можуть зловживати будь-хто із поганими намірами. Сюди входять (шкідливі) компанії та організації.

Поганий аналіз даних

Багато компаній та організацій збирають великі дані, оскільки вони можуть використовувати їх для цікавого аналізу. Це може дати їм важливі нові уявлення про те, що вони досліджують (наприклад, звички споживачів). У свою чергу, ці розуміння та висновки можуть призвести до змін у компанії, які призводять до підвищення маржі та отримання більшого прибутку. Однак, як і будь-який інший звичайний набір даних, неправильний аналіз великих даних може мати серйозні наслідки. Адже неправильний аналіз може легко призвести до неправильних висновків. Це в свою чергу може призвести до неефективних або навіть контрпродуктивних заходів, що вживаються.

Збір “неправильних” даних

Великі дані стають все більш популярними, і організації все більше і більше бажають збирати всілякі дані. Це означає, що збираються гігантські обсяги даних, не маючи чіткої причини їх аналізу. Іншими словами, він створює величезну базу необробленої інформації, яка була зібрана на всякий випадок. Компанії, ймовірно, думають, що зібрати всі ці дані досить просто, щоб вони могли це зробити. Потрібно сказати, що це не добре для конфіденційності кого-небудь. Це навіть може призвести до збору та аналізу невідповідних чи «неправильних» даних. Якщо висновки, зроблені з цього аналізу, будуть використані в управлінні, це може призвести до тих же неефективних заходів, про які йдеться в попередньому пункті.

Збір та збереження великих даних з поганими намірами

Збір великих даних все частіше використовується компаніями, організаціями та урядами, щоб вони могли робити точні індивідуальні профілі для людей. Користувачі або громадяни майже ніколи не отримують повідомлення про те, які з їх персональних даних реєструються, не кажучи вже про те, чому і як. Потрібно говорити, що це має серйозні наслідки для конфіденційності в Інтернеті. Все, що вони роблять в Інтернеті, можна зберегти і переглянути потім. Більше того, великі збирачі даних можуть легко впливати та маніпулювати прийняттям рішень людей шляхом аналізу та використання зібраних даних.

Великі дані та конфіденційність

Смартфон із зображенням вухоЯк ви, напевно, зрозумієте, великі дані мають багато недоліків та ризиків. Тим не менш, багато компаній і організацій все ще збирають дані у величезному масштабі, в основному через те, як це може допомогти їм рости і розвиватися. Збір великих даних простіше, ніж будь-коли раніше. Це має величезні наслідки для нашої конфіденційності. Ми вже коротко обговорили можливі небезпеки для конфіденційності зловмисних сторін, які збирають погані дані. Оскільки наша конфіденційність настільки тісно пов’язана з масовим збором особистих даних, ми хочемо використовувати цей розділ для обговорення різних проблем конфіденційності, які виникають із великими даними.

Широкомасштабний збір даних

Багато компаній, включаючи Google, Facebook та Twitter, сильно залежать від реклами, щоб підтримувати себе та отримувати прибуток. Щоб зробити цю рекламу максимально ефективною, ці компанії роблять детальні профілі для своїх користувачів, особливо з урахуванням їх лайків та інтересів. Це форма великих даних. Так само уряди та секретні служби залежать також від великих даних. Вони використовують цю величезну кількість інформації для відстеження та розслідування людей, яких вони вважають підозрілими. Звичайно, це також означає, що для кіберзлочинців існує велика кількість даних, а також навіть маніпулювання та зловживання. Це може створити всілякі проблеми з конфіденційністю та особистими ознаками. Те, що спадає на думку, – це крадіжка особи.

Тим не менш, можливості, що надходять зі збором у базах даних, набагато ширші, ніж це. У наші дні технологія стала настільки передовою та “розумною”, що може поєднувати набори даних. Це можна зробити настільки розумним і хитрим способом, що великі корпорації та організації, ймовірно, знають про вас більше, ніж ви! Хто ти, де живеш, які твої захоплення, хто твої друзі: жодна з цих даних більше не буде приватною. Не дуже втішна думка, можна подумати. На щастя, є кілька способів захистити себе від масштабного порушення конфіденційності великих даних.

Закони про конфіденційність

Файли cookie на екраніЗакони та положення про конфіденційність можуть захистити нас від порушення конфіденційності, але лише до певної міри. Щоб ускладнити питання, закони про конфіденційність часто сильно відрізняються між різними країнами та регіонами. Наприклад, в Європі діє відносно жорсткий закон про конфіденційність споживачів, який називається Загальним регламентом захисту даних (GDPR). Цей закон застосовується до всіх країн-членів ЄС, хоча деталі можуть відрізнятися для кожної країни. Багато міжнародних компаній вирішили дотримати весь свій бізнес до GDPR. Саме тому Google, наприклад, тепер дозволяє користувачам вимагати видалення особистої інформації. Однак закони про конфіденційність у США відрізняються від штату до штату і не захищають споживачів, а також ЄС. На жаль, це стосується навіть найсуворішого закону про конфіденційність у США, Каліфорнійського закону про конфіденційність споживачів.

Коротше кажучи, немає такого поняття, як чіткий “глобальний” закон про конфіденційність, який застосовується до всіх великих збирачів даних і захищає всіх користувачів. Це означає, що наші конфіденційності не тільки завдають шкоди великим збирачам даних незаконним шляхом, але навіть ідеально законними способами, як би це парадоксально не звучало. На щастя, масштабні порушення конфіденційності, які піддаються свистям, як Едвард Сноуден та Челсі Меннінг, значно підвищили рівень обізнаності щодо ризиків великих даних. Звичайно, це лише перший крок до вдосконалення чинного законодавства про конфіденційність.

Багато користувачів Інтернету не бажають чекати вдосконалення законів про конфіденційність – і це справедливо. Швидше вони хочуть вжити самих дій, роблячи все можливе, щоб захистити свою конфіденційність. Чи хочете ви також не стати частиною безлічі великих наборів даних? Існує кілька порад та рекомендацій, які допоможуть вам на шляху.

Як запобігти збереженню ваших даних у великих наборах даних

Великі набори даних серйозно впливають на вашу конфіденційність та безпеку. Ці набори даних можуть містити всіляку (особисту) інформацію, якою можуть зловживати великі компанії чи навіть кіберзлочинці. Ось чому завжди потрібно залишати якомога менше слідів в Інтернеті. Наступні поради можуть допомогти вам досягти цього:

  • Постарайтеся мінімізувати використання вашої особистої інформації під час створення паролів або взагалі в Інтернеті. Наприклад: уникайте використання свого імені, адреси, номера телефону, дати народження тощо.
  • Завжди пам’ятайте таке: все, що ви опублікуєте в Інтернеті, буде там назавжди. Це може бути не завжди правдою, але такий рівень обережності допомагає захистити вашу конфіденційність. Ви автоматично дбаєте про свої приватні дані, коли дізнаєтесь про цей факт.
  • Переконайтеся, що ваше інтернет-з’єднання захищено та анонімізовано, наприклад, використовуючи браузер Tor або VPN, наприклад.
  • Використовуйте один або кілька блокаторів реклами у своєму браузері.
  • Використовуйте вбудовані веб-переглядачі або більше, які блокують трекери та файли cookie.
  • Регулярно очищайте кеш і видаляйте історію перегляду та файли cookie.
  • Виходьте з веб-сайтів, коли ви активно не використовуєте їх.

Вживання цих кроків – це гарний початок, коли мова йде про захист вашої конфіденційності та безпеки в Інтернеті. Майте на увазі, що великі дані збираються різними способами – не лише в Інтернеті. Коротше кажучи, де б ви не були і чим займаєтесь, ви завжди повинні бути пильними і намагатися захистити свої (особисті) дані від великих збирачів даних..

Kim Martin Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map