Data & privasi yang besar: Apakah risiko privasi? | Tinjauan VPNO

Selama beberapa dekade terakhir, dunia telah banyak berubah dalam banyak hal, terutama dalam hal IT. Jumlah orang yang dapat kami berhubung dengan setiap hari telah bertambah banyak, sama seperti jumlah maklumat yang dapat kami akses. Namun, perkara yang sama berlaku untuk jumlah maklumat yang dikumpulkan syarikat besar mengenai kami. Istilah seperti data besar digunakan lebih kerap seiring berjalannya waktu. Tetapi apa maksudnya, sebenarnya? Apa itu data besar? Adakah ia berbahaya? Bagaimana ia mempengaruhi privasi kami, jika sama sekali? Itulah beberapa persoalan yang akan kita bahas dalam artikel ini.


Apa itu data besar?

Senaraikan dengan kaca pembesarIstilah “data besar” menggambarkan sejumlah besar data (peribadi) yang terus dikumpulkan oleh pelaku yang berbeza. Contohnya ialah semua maklumat yang dikumpulkan oleh Google mengenai pertanyaan carian penggunanya. Fenomena data besar adalah perkembangan yang agak baru yang bermula kerana syarikat dan organisasi (besar), seperti Facebook, Google dan kebanyakan pemerintah, mulai mengumpulkan lebih banyak data mengenai pengguna, pelanggan dan warganya daripada sebelumnya. Teknologi baru, dunia digital dan internet telah banyak membantu perkembangan ini.

Koleksi data besar sering sekali sehingga mustahil untuk menganalisisnya menggunakan analisis data tradisional. Walau bagaimanapun, jika seseorang menganalisis data besar dengan cara yang betul, corak dan kesimpulan yang menarik dapat dihasilkan. Sebagai contoh, data besar sering digunakan untuk penyelidikan pasaran berskala besar: produk mana yang kemungkinan besar akan dibeli? Jenis iklan apa yang paling berkesan apabila anda ingin menjangkau dan meyakinkan pelanggan?

Agar set data dianggap sebagai data besar, biasanya harus memenuhi tiga kriteria berikut, juga dikenal sebagai 3 v:

  • Isipadu: Data besar hanyalah sampel kecil. Ia melibatkan pengumpulan data yang banyak, hasil dari pemerhatian yang panjang dan berterusan.
  • Kelajuan: Ini berkaitan dengan kelajuan mengagumkan di mana data besar dikumpulkan. Lebih-lebih lagi, data besar sering diakses dalam masa nyata (kerana ia dikumpulkan).
  • Pelbagai: Set data besar sering mengandungi pelbagai jenis maklumat. Data dalam kumpulan data besar bahkan dapat digabungkan untuk mengisi jurang dan menjadikan set data lebih lengkap.

Selain 3 v ini, data besar mempunyai beberapa ciri lain. Sebagai contoh, data besar sangat bagus untuk pembelajaran mesin. Ini bermaksud ia dapat digunakan dengan berkesan untuk mengajar komputer dan mesin tugas-tugas tertentu. Selain itu, seperti yang telah kita bahas sebentar, data besar dapat digunakan untuk mengesan corak. Ini kebanyakannya berlaku dengan cara yang sangat berkesan, dengan menggunakan komputer yang menggunakan data. Akhirnya, data besar adalah gambaran cap jari digital pengguna. Ini bermaksud produk sampingan dari aktiviti digital dan dalam talian orang dan boleh digunakan untuk membina profil peribadi individu.

Berbagai jenis data besar

Terdapat pelbagai cara untuk mengklasifikasikan data besar. Cara pertama, yang paling sering digunakan, membezakan data besar berdasarkan jenis data yang dikumpulkan. Tiga kategori yang mungkin digunakan untuk jenis klasifikasi ini adalah: data besar berstruktur, data besar tidak berstruktur dan data besar separa berstruktur.

  1. Berstruktur: Apabila data besar disusun, data dapat disimpan dan disajikan secara teratur dan logik, menjadikan data lebih mudah diakses dan lebih mudah difahami. Contohnya ialah senarai alamat pelanggan yang dibuat oleh syarikat. Dalam senarai ini, seseorang mungkin akan mencari nama, alamat pelanggan dan mungkin butiran lain seperti nombor telefon, semuanya tersusun dengan jelas, misalnya, carta atau jadual.
  2. Tidak berstruktur: Data besar tidak berstruktur sama sekali tidak tersusun. Ia tidak mempunyai persembahan logik yang masuk akal bagi rata-rata manusia. Data besar tidak berstruktur tidak memiliki struktur, misalnya, tabel yang menunjukkan koherensi tertentu antara elemen yang berlainan dari kumpulan data. Oleh itu data jenis ini agak sukar untuk dilayari dan difahami. Banyak set data pada mulanya bermula sebagai data besar yang tidak tersusun.
  3. Separa berstruktur: Data besar separa berstruktur, seperti yang anda duga, mempunyai ciri data besar berstruktur dan tidak berstruktur. Sifat dan gambaran data jenis ini tidak sepenuhnya sewenang-wenang. Namun tidak tersusun dan teratur untuk digunakan untuk analisis yang bermakna. Contohnya adalah laman web yang berisi tag data meta tertentu (maklumat tambahan yang tidak dapat dilihat secara langsung dalam teks), misalnya kerana mengandungi kata kunci tertentu. Teg ini menunjukkan maklumat yang berkesan, seperti pengarang halaman atau saat ia diletakkan dalam talian. Teks itu sendiri pada dasarnya tidak terstruktur, namun kata kunci dan data meta lain yang mengandungi bantuan menjadikannya asas yang sesuai untuk analisis.

Klasifikasi berdasarkan sumber data besar

Kaedah umum lain untuk membezakan antara pelbagai jenis data besar adalah dengan melihat sumber data. Siapa atau apa yang menghasilkan maklumat itu? Seperti rancangan sebelumnya, kaedah klasifikasi ini juga terdiri daripada 3 kategori yang berbeza.

  1. Orang ramai: Kategori ini berkaitan dengan data besar yang dihasilkan oleh orang. Contohnya ialah buku, gambar, video serta maklumat dan (peribadi) data di laman web dan media sosial, seperti Facebook, Twitter, Instagram, dan sebagainya.
  2. Proses pendaftaran: Kategori ini merangkumi jenis data besar yang lebih tradisional, yang dikumpulkan dan dianalisis oleh syarikat (besar) untuk meningkatkan proses tertentu dalam perniagaan.
  3. Mesin: Jenis data besar ini dihasilkan dari jumlah sensor yang semakin meningkat yang diletakkan di dalam mesin. Contohnya ialah sensor haba yang sering dimasukkan ke dalam pemproses komputer. Data yang dihasilkan oleh mesin seringkali sangat kompleks, tetapi sekurang-kurangnya jenis data besar ini umumnya tersusun dan lengkap.

Untuk apa data besar boleh digunakan?

Logo FacebookSemua yang dibincangkan setakat ini mungkin masih terdengar agak abstrak. Mari buat perkara lebih konkrit dan bincangkan beberapa aplikasi data besar dalam kehidupan sebenar. Bagaimanapun, terdapat banyak cara syarikat dan organisasi menggunakan data besar. Salah satu perkara pertama yang terlintas di fikiran adalah banyaknya data yang dikumpulkan syarikat mengenai kami. Facebook mengumpulkan data mengenai semua penggunanya dan menganalisisnya untuk menentukan apa yang akan ditunjukkan kepada anda pada garis masa anda. Sudah tentu, ini dilakukan untuk memenuhi kehendak dan minat peribadi anda. Facebook berharap ini dapat membuatkan anda terus berada di laman web mereka untuk jangka masa yang lebih lama. Sebaliknya, Amazon mengumpulkan maklumat mengenai pelanggannya dan produk yang mereka beli. Dengan cara itu, Amazon dapat mengesyorkan produk yang mereka rasa anda akan minat dan meningkatkan pendapatan mereka dengan cara ini.

Walau bagaimanapun, data besar juga digunakan dengan cara yang sama sekali berbeza dengan strategi komersial yang dinyatakan di atas. Sebagai contoh, syarikat pengangkutan awam dapat mengumpulkan data tentang betapa sibuknya laluan tertentu. Setelah itu, mereka dapat menganalisis data ini untuk memutuskan, misalnya, rute mana yang memerlukan bas atau kereta api tambahan. Satu lagi kes penggunaan data besar yang berkesan adalah UPS gergasi penghantaran antarabangsa. UPS menggunakan perisian khas yang dikembangkan setelah analisis data besar. Perisian ini membantu pemandu UPS mengelakkan belokan kiri, yang lebih mahal, lebih boros dan lebih berbahaya daripada belok kanan. Sepatutnya, sistem ini sudah menjimatkan jutaan bahan bakar UPS, semuanya berkat data besar.

Contoh menarik lain pengumpulan data besar adalah ujian DNA dan laman web seperti DNA MyHeritage. Laman web ini mendakwa ia dapat membantu anda “mengungkap asal usul etnik anda dan mencari saudara baru” dengan ujian DNA yang mudah. Tidak perlu dikatakan, proses ini melibatkan banyak pengumpulan data dan rujukan silang, menjadikannya pemain utama lain dalam pengumpulan dan penggunaan data besar. “Tradisional”, ujian DNA fizikal juga melibatkan sejumlah besar data besar, kerana syarikat yang menjalankan ujian ini akan memperoleh kumpulan data yang sangat besar mengenai banyak orang. Sudah tentu, penting untuk mengetahui kemungkinan risiko yang timbul dalam proses pengumpulan data yang besar ini. Risiko ini akan diketengahkan pada bahagian seterusnya artikel ini.

Adakah data besar berbahaya?

Seperti yang ditunjukkan di atas, data besar dapat sangat berguna dalam banyak kes. Ini memberi kita banyak maklumat yang dapat kita gunakan untuk melancarkan proses dan menjadikan syarikat lebih cekap dan menguntungkan. Namun, ini tidak bermaksud mengumpulkan dan menggunakan data besar benar-benar bebas risiko. Terdapat lima risiko penting yang disertakan dengan data besar. Kami akan membincangkan kelima-lima di sini.

Peretas dan pencuri

Dengan semua yang kami lakukan dalam talian, ada risiko yang wujud bahawa data dan maklumat peribadi kami mengenai aktiviti internet kami dapat dicuri. Setiap pengguna internet harus menyedari perkara ini. Bilangan kebocoran dan kecurian data telah meningkat secara drastik sejak beberapa tahun kebelakangan ini. Sering ada berita dalam berita mengenai penjenayah menjual set data yang mengandungi kata laluan dan maklumat lain di tempat-tempat seperti laman web gelap. Selalunya, set data ini dicuri dari laman web rasmi, syarikat dan organisasi. Semakin besar set data ini, semakin menarik bagi pencuri untuk mencuba mendapatkannya. Sekiranya mereka menggunakan set data ini, mereka boleh menyebabkan banyak masalah. Tidak perlu dikatakan, ini juga boleh menjejaskan privasi anda.

Privasi

Amalan mengumpulkan data peribadi semakin berleluasa. Walau bagaimanapun, peraturan privasi semasa tidak dapat mengikuti perkembangan teknologi yang pesat yang menjadikan praktik ini dapat dilakukan. Ini memberi ruang kepada kawasan kelabu dan ketidakpastian yang tidak dapat diselesaikan dengan melihat undang-undang. Kebimbangan privasi penting yang timbul termasuk: Jenis data apa yang dibenarkan untuk dikumpulkan? Mengenai siapa? Siapa yang harus mempunyai akses ke data ini?

Semasa mengumpulkan sejumlah besar data, kemungkinan maklumat peribadi sensitif dimasukkan ke dalam set data tersebut adalah tinggi. Ini bermasalah, walaupun penggodam dan pencuri tidak bermain. Bagaimanapun, data sensitif privasi boleh disalahgunakan oleh sesiapa yang tidak berniat jahat. Ini merangkumi (berniat jahat) syarikat dan organisasi.

Analisis data yang lemah

Banyak syarikat dan organisasi mengumpulkan data besar, kerana mereka dapat menggunakannya untuk analisis yang menarik. Ini mungkin memberi mereka wawasan baru yang penting mengenai apa sahaja yang mereka teliti (seperti, misalnya, kebiasaan pengguna). Sebaliknya, pandangan dan kesimpulan ini dapat diterjemahkan kepada perubahan dalam syarikat yang menghasilkan margin yang lebih tinggi dan lebih banyak keuntungan. Namun, seperti mana-mana set data biasa yang lain, analisis data besar yang salah boleh membawa akibat yang serius. Bagaimanapun, analisis yang tidak betul dapat dengan mudah membuat kesimpulan yang salah. Ini pada gilirannya dapat diterjemahkan kepada langkah-langkah yang tidak berkesan atau bahkan kontraproduktif yang diambil.

Mengumpulkan data “salah”

Data besar menjadi semakin popular dan organisasi semakin bersedia untuk mengumpulkan pelbagai jenis data. Ini bermaksud sejumlah besar data dikumpulkan tanpa ada alasan yang jelas untuk menganalisisnya. Dengan kata lain, ia membuat pangkalan data besar maklumat mentah yang telah dikumpulkan untuk berjaga-jaga. Syarikat mungkin menganggap cukup mudah untuk mengumpulkan semua data itu, jadi mereka juga dapat melakukannya. Tidak perlu dikatakan, ini tidak baik untuk privasi sesiapa sahaja. Bahkan boleh menyebabkan data yang tidak relevan atau “salah” dikumpulkan dan dianalisis. Sekiranya kesimpulan yang diambil dari analisis ini digunakan dalam manajemen, ini dapat menyebabkan tindakan yang tidak efektif yang sama yang disebutkan dalam perenggan sebelumnya.

Mengumpulkan dan menyimpan data besar dengan niat tidak baik

Pengumpulan data besar digunakan lebih banyak dan lebih kerap oleh syarikat, organisasi dan kerajaan sehingga mereka dapat membuat profil individu yang tepat pada orang. Pengguna atau warganegara hampir tidak pernah diberitahu mengenai data peribadi mereka yang mana yang didaftarkan, apalagi mengapa dan bagaimana. Tidak perlu dikatakan, ini mempunyai implikasi serius terhadap privasi dalam talian mereka. Semua yang mereka lakukan dalam talian, dapat disimpan dan dilihat kemudian. Lebih-lebih lagi, pengumpul data yang besar dapat dengan mudah mempengaruhi dan memanipulasi pengambilan keputusan orang dengan menganalisis dan menggunakan data yang dikumpulkan.

Data dan privasi yang besar

Telefon pintar dengan gambar telingaSeperti yang mungkin anda fahami sekarang, data besar dilengkapi dengan banyak kekurangan dan risiko. Walaupun begitu, banyak syarikat dan organisasi masih mengumpulkan data dalam skala besar, terutama kerana bagaimana ia dapat membantu mereka berkembang dan maju. Mengumpulkan data besar lebih mudah daripada sebelumnya. Ini mempunyai kesan besar terhadap privasi kami. Kami telah membincangkan secara ringkas kemungkinan bahaya privasi pihak jahat yang mengumpulkan data buruk. Oleh kerana privasi kami sangat berkaitan dengan pengumpulan data peribadi secara besar-besaran, kami ingin menggunakan bahagian ini untuk membincangkan kebimbangan privasi yang berbeza dengan data besar.

Pengumpulan data berskala besar

Banyak syarikat, termasuk Google, Facebook dan Twitter, sangat bergantung pada iklan untuk mempertahankan diri dan memperoleh keuntungan. Untuk menjadikan iklan ini seefektif mungkin, syarikat-syarikat ini membuat profil terperinci mengenai penggunanya, terutama dengan mengambil kira suka dan minat mereka. Ini adalah bentuk data besar. Begitu juga, kerajaan dan perkhidmatan rahsia bergantung pada data besar juga. Mereka menggunakan sejumlah besar maklumat ini untuk mengesan dan menyiasat orang yang mereka anggap mencurigakan. Sudah tentu, ini juga bermaksud terdapat banyak data besar bagi penjenayah siber untuk memanfaatkannya dan mungkin juga melakukan manipulasi dan penyalahgunaan. Ini boleh menimbulkan pelbagai masalah berkaitan privasi dan identiti. Satu yang terlintas di fikiran, adalah pencurian identiti.

Namun, kemungkinan yang terdapat dalam koleksi dalam pangkalan data jauh lebih luas daripada ini. Hari-hari ini, teknologi telah menjadi sangat maju dan “pintar” sehingga dapat menggabungkan set data. Ini dapat dilakukan dengan cara yang cerdik dan licik, sehingga syarikat dan organisasi besar mungkin mengetahui lebih banyak tentang anda daripada anda! Siapa anda, di mana anda tinggal, apa hobi anda, siapa rakan anda: tiada maklumat ini akan menjadi rahsia lagi. Bukan pemikiran yang sangat menenangkan, anda mungkin berfikir. Nasib baik, ada beberapa cara untuk melindungi diri anda dari pelanggaran privasi skala besar yang boleh disebabkan oleh data besar.

Undang-undang mengenai privasi

Kuki di skrinUndang-undang dan peraturan privasi dapat melindungi kita dari pelanggaran privasi, tetapi hanya sampai batas tertentu. Untuk menjadikan perkara lebih rumit, undang-undang privasi sering kali berbeza antara negara dan wilayah yang berbeza. Sebagai contoh, di Eropah undang-undang privasi pengguna yang cukup ketat yang disebut Peraturan Perlindungan Data Umum (GDPR) sedang berlaku. Undang-undang ini berlaku untuk semua negara anggota EU, walaupun perinciannya mungkin berbeza di setiap negara. Banyak syarikat antarabangsa telah memutuskan untuk mematuhi semua perniagaan mereka kepada GDPR. Inilah sebabnya mengapa Google, misalnya, kini membenarkan pengguna meminta penghapusan maklumat peribadi. Walau bagaimanapun, undang-undang privasi di Amerika Syarikat berbeza dari negeri ke negeri dan tidak melindungi pengguna serta EU. Malangnya, ini berlaku untuk undang-undang privasi yang paling sukar di AS, iaitu California Consumer Privacy Act.

Ringkasnya, tidak ada undang-undang privasi “global” yang kuat yang berlaku untuk semua pengumpul data besar dan melindungi semua pengguna. Ini bermaksud privasi kami tidak hanya dirugikan oleh pengumpul data yang besar secara haram, tetapi juga dengan cara yang sah, sama paradoksnya seperti ini. Nasib baik, pelanggaran privasi berskala besar yang didedahkan oleh pemberi maklumat seperti Edward Snowden dan Chelsea Manning telah meningkatkan kesedaran akan risiko data besar. Sudah tentu, ini hanya langkah pertama untuk meningkatkan undang-undang privasi semasa.

Banyak pengguna internet tidak bersedia menunggu peningkatan undang-undang privasi – dan memang demikian. Sebaliknya, mereka ingin mengambil tindakan sendiri dengan melakukan apa sahaja untuk melindungi privasi mereka. Adakah anda mahu mengelakkan menjadi sebahagian daripada kumpulan data besar juga? Terdapat beberapa petua dan trik untuk membantu anda dalam perjalanan.

Cara memastikan data anda tidak disimpan dalam set data besar

Set data yang besar menjejaskan privasi dan keselamatan anda. Set data ini mungkin mengandungi semua jenis maklumat (peribadi), yang boleh disalahgunakan oleh syarikat besar atau bahkan penjenayah siber. Itulah sebabnya anda harus selalu memastikan meninggalkan jejak dalam talian sebanyak mungkin. Petua berikut dapat membantu anda mencapainya:

  • Cuba meminimumkan penggunaan maklumat peribadi anda semasa membuat kata laluan atau secara umum di web. Contohnya: elakkan menggunakan nama, alamat, nombor telefon, tarikh lahir, dan sebagainya.
  • Sentiasa ingat yang berikut: semua yang anda terbitkan di internet, akan sentiasa ada di sana. Ini mungkin tidak selalu benar, tetapi tahap berhati-hati ini membantu melindungi privasi anda. Anda akan mengurus data peribadi anda secara automatik dengan lebih berhati-hati setelah menyedari hakikat ini.
  • Pastikan sambungan internet anda selamat dan tanpa nama, misalnya dengan menggunakan penyemak imbas Tor atau VPN misalnya.
  • Gunakan satu atau beberapa penyekat iklan di penyemak imbas anda.
  • Gunakan pemalam penyemak imbas atau lebih yang menyekat pelacak dan kuki.
  • Kosongkan cache anda secara berkala dan hapus sejarah penyemak imbas dan kuki anda.
  • Log keluar dari laman web apabila anda tidak menggunakannya secara aktif.

Mengambil langkah-langkah ini adalah permulaan yang baik untuk menjaga privasi dan keselamatan dalam talian anda. Namun, ingat bahawa data besar dikumpulkan dalam pelbagai cara – bukan hanya dalam talian. Ringkasnya, di mana sahaja anda berada dan apa sahaja yang anda lakukan, anda harus selalu waspada dan berusaha melindungi data (peribadi) anda dari pengumpul data besar.

Kim Martin
Kim Martin Administrator
Sorry! The Author has not filled his profile.
follow me