Data besar & privasi: Apa risiko privasinya? | VPNOverview

Selama beberapa dekade terakhir, dunia telah banyak berubah dalam banyak hal, terutama dalam hal IT. Jumlah orang yang dapat kami ajak berkomunikasi setiap hari telah berkembang pesat, seperti halnya jumlah informasi yang kami miliki. Namun, hal yang sama berlaku untuk jumlah informasi yang dikumpulkan perusahaan besar tentang kami. Istilah seperti big data digunakan lebih sering seiring berjalannya waktu. Tapi apa artinya ini, tepatnya? Apa itu big data? Apa ini berbahaya? Bagaimana pengaruhnya terhadap privasi kita, jika sama sekali? Itulah beberapa pertanyaan yang akan kami bahas di artikel ini.


Apa itu big data??

Daftar dengan kaca pembesarIstilah “data besar” menggambarkan data (pribadi) dalam jumlah sangat besar yang terus-menerus dikumpulkan oleh berbagai pelaku. Contohnya adalah semua informasi yang dikumpulkan Google tentang permintaan pencarian penggunanya. Fenomena big data adalah perkembangan yang relatif baru yang dimulai karena (besar) perusahaan dan organisasi, seperti Facebook, Google dan sebagian besar pemerintah, mulai mengumpulkan lebih banyak data tentang pengguna, pelanggan, dan warga negara daripada sebelumnya. Teknologi baru, dunia digital dan internet telah banyak membantu perkembangan ini.

Koleksi data besar seringkali sangat luas sehingga tidak mungkin untuk menganalisisnya menggunakan analisis data tradisional. Namun, jika seseorang menganalisis data besar dengan cara yang benar, pola dan kesimpulan yang menarik dapat diinduksi. Misalnya, data besar sering digunakan untuk riset pasar skala besar: produk mana yang paling mungkin dibeli? Jenis iklan apa yang paling efektif ketika Anda ingin menjangkau dan membujuk pelanggan?

Agar dataset dianggap sebagai data besar, biasanya harus memenuhi tiga kriteria berikut, juga dikenal sebagai 3 v:

  • Volume: Data besar sama sekali bukan sampel kecil. Ini melibatkan koleksi data yang sangat besar, yang dihasilkan dari pengamatan yang panjang dan terus menerus.
  • Kecepatan: Ini ada hubungannya dengan kecepatan mengesankan di mana data besar dikumpulkan. Selain itu, data besar seringkali dapat diakses secara waktu nyata (saat sedang dikumpulkan).
  • Variasi: Kumpulan data besar sering mengandung berbagai jenis informasi. Data dalam kumpulan data besar bahkan bisa digabungkan untuk mengisi celah dan membuat dataset lebih lengkap.

Selain 3 v ini, big data memiliki beberapa karakteristik lain. Misalnya, data besar sangat bagus untuk pembelajaran mesin. Ini berarti dapat secara efektif digunakan untuk mengajarkan komputer dan mesin tugas-tugas tertentu. Selain itu, seperti yang sudah kami singgung sebentar, data besar dapat digunakan untuk mendeteksi pola. Ini sebagian besar terjadi dengan cara yang sangat efektif, dengan cara komputer bekerja pada data. Akhirnya, data besar adalah refleksi dari sidik jari digital pengguna. Ini berarti produk sampingan dari aktivitas digital dan online orang dan dapat digunakan untuk membangun profil pribadi masing-masing.

Berbagai jenis big data

Ada berbagai cara untuk mengklasifikasikan data besar. Cara pertama, yang paling sering digunakan, membedakan data besar berdasarkan jenis data yang sedang dikumpulkan. Tiga kategori yang mungkin digunakan untuk jenis klasifikasi ini adalah: big data terstruktur, big data tidak terstruktur, dan big data semi terstruktur.

  1. Tersusun: Ketika big data disusun, itu dapat disimpan dan disajikan dengan cara yang terorganisir dan logis, membuat data lebih mudah diakses dan lebih mudah dipahami. Contohnya adalah daftar alamat pelanggan yang dibuat oleh perusahaan. Dalam daftar ini, orang mungkin akan menemukan nama, alamat, dan mungkin detail pelanggan lainnya seperti nomor telepon, semua terstruktur dengan jelas, misalnya, bagan atau tabel.
  2. Tidak terstruktur: Data besar yang tidak terstruktur sama sekali tidak terorganisir. Itu tidak memiliki presentasi logis yang masuk akal bagi manusia rata-rata. Data besar yang tidak terstruktur tidak memiliki struktur, misalnya, tabel yang menunjukkan koherensi tertentu antara elemen-elemen yang berbeda dari kumpulan data. Karenanya tipe data ini cukup sulit dinavigasi dan dipahami. Banyak dataset awalnya dimulai sebagai data besar yang tidak terstruktur.
  3. Semi terstruktur: Data besar semi-terstruktur, seperti yang Anda duga, memiliki karakteristik data besar terstruktur dan tidak terstruktur. Sifat dan representasi dari tipe data ini tidak sepenuhnya arbitrer. Namun itu tidak terstruktur dan cukup terorganisir untuk digunakan untuk analisis yang bermakna. Contohnya adalah halaman web yang berisi tag meta data spesifik (informasi tambahan yang tidak langsung terlihat dalam teks), misalnya karena mengandung kata kunci tertentu. Tag ini secara efektif menunjukkan bit informasi tertentu, seperti penulis halaman atau saat itu ditempatkan online. Teks itu sendiri pada dasarnya tidak terstruktur, namun kata kunci dan data meta lainnya yang dikandungnya membantu membuatnya menjadi dasar yang cocok untuk analisis.

Klasifikasi berdasarkan sumber big data

Cara umum lainnya untuk membedakan berbagai jenis big data adalah dengan melihat sumber data. Siapa atau apa yang menghasilkan informasi? Seperti devisi sebelumnya, metode klasifikasi ini juga terdiri dari 3 kategori berbeda.

  1. Orang-orang: Kategori ini menyangkut data besar yang dihasilkan oleh orang-orang. Contohnya adalah buku, gambar, video, serta informasi dan data (pribadi) di situs web dan media sosial, seperti Facebook, Twitter, Instagram, dan sebagainya..
  2. Proses pendaftaran: Kategori ini mencakup jenis big data yang lebih tradisional, yang dikumpulkan dan dianalisis oleh perusahaan (besar) untuk meningkatkan proses tertentu dalam bisnis.
  3. Mesin: Jenis data besar ini dihasilkan dari semakin banyaknya sensor yang ditempatkan di mesin. Contohnya adalah sensor panas yang sering dibangun ke prosesor komputer. Data yang dihasilkan oleh mesin seringkali sangat kompleks, tetapi setidaknya jenis data besar ini umumnya terstruktur dengan baik dan lengkap.

Untuk apa data besar dapat digunakan?

Logo FacebookSemua yang dibahas sejauh ini mungkin masih terdengar agak abstrak. Mari kita membuat hal-hal sedikit lebih konkret dan membahas beberapa aplikasi nyata dari data besar. Bagaimanapun, ada banyak, banyak cara di mana perusahaan dan organisasi menggunakan data besar. Salah satu hal pertama yang terlintas dalam pikiran adalah banyaknya data yang dikumpulkan oleh perusahaan tentang kami. Facebook mengumpulkan data pada semua penggunanya dan menganalisis ini untuk memutuskan apa yang akan ditampilkan kepada Anda di timeline Anda. Tentu saja, ini dilakukan untuk memenuhi keinginan dan minat pribadi Anda. Facebook berharap ini akan membuat Anda tetap di situs web mereka untuk jangka waktu yang lebih lama. Pada gilirannya, Amazon mengumpulkan informasi tentang klien dan produk yang mereka beli. Dengan begitu, Amazon dapat merekomendasikan produk yang mereka pikir Anda akan tertarik dan meningkatkan penghasilan mereka dengan cara ini.

Namun, data besar juga digunakan dengan cara yang sangat berbeda dari strategi komersial yang dijelaskan di atas. Misalnya, perusahaan angkutan umum dapat mengumpulkan data tentang seberapa sibuk rute tertentu. Setelah itu, mereka dapat menganalisis data ini untuk memutuskan, misalnya, rute mana yang membutuhkan bus atau kereta tambahan. Kasus lain yang terkenal tentang penggunaan data besar yang efektif menyangkut UPS raksasa pengiriman internasional. UPS menggunakan perangkat lunak khusus yang dikembangkan setelah analisis data besar. Perangkat lunak ini membantu pengemudi UPS menghindari belokan kiri, yang lebih mahal, lebih boros dan lebih berbahaya daripada belokan kanan. Seharusnya, sistem ini telah menghemat jutaan galon UPS dalam bahan bakar, semuanya berkat data besar.

Contoh menarik lainnya dari pengumpulan data besar adalah tes DNA dan situs web seperti MyHeritage DNA. Situs web ini mengklaim dapat membantu Anda “mengungkap asal etnis Anda dan menemukan kerabat baru” dengan tes DNA sederhana. Tidak perlu dikatakan, proses ini melibatkan banyak pengumpulan data dan referensi silang, menjadikannya pemain utama dalam pengumpulan dan penggunaan data besar. “Tradisional”, tes DNA fisik juga melibatkan sejumlah besar data besar, karena perusahaan yang melakukan tes ini akan mendapatkan kumpulan data yang sangat besar tentang banyak orang. Tentu saja, penting untuk mewaspadai kemungkinan risiko yang datang dengan proses pengumpulan data besar ini. Risiko-risiko ini akan disorot di bagian selanjutnya dari artikel ini.

Apakah data besar berbahaya??

Seperti yang ditunjukkan di atas, data besar dapat sangat berguna dalam banyak kasus. Ini memberi kami banyak informasi yang dapat kami gunakan untuk merampingkan proses dan membuat perusahaan lebih efisien dan menguntungkan. Namun, ini tidak berarti mengumpulkan dan menggunakan data besar sepenuhnya bebas risiko. Ada lima risiko penting yang datang dengan data besar. Kami akan membahas kelima di sini.

Peretas dan pencuri

Dengan semua yang kami lakukan online, ada risiko yang melekat bahwa data pribadi kami dan informasi tentang kegiatan internet kami dapat dicuri. Setiap pengguna internet harus mengetahui hal ini. Jumlah kebocoran dan pencurian data telah meningkat secara drastis selama beberapa tahun terakhir. Sering ada berita di berita tentang penjahat yang menjual set data yang berisi kata sandi dan informasi lainnya di tempat-tempat seperti web gelap. Seringkali, kumpulan data ini dicuri dari situs web, perusahaan, dan organisasi resmi. Semakin besar kumpulan data ini, semakin menarik bagi pencuri untuk mencoba mendapatkannya. Jika mereka mendapatkan set data ini, mereka dapat menyebabkan banyak masalah. Tak perlu dikatakan, ini juga bisa sangat membahayakan privasi Anda.

Pribadi

Praktek pengumpulan data pribadi menjadi semakin luas. Namun, peraturan privasi saat ini tidak dapat mengimbangi perkembangan pesat dalam teknologi yang memungkinkan praktik ini. Ini menyisakan ruang untuk area abu-abu dan ketidakpastian yang tidak dapat diselesaikan dengan melihat hukum. Masalah privasi penting yang muncul meliputi: Data apa yang diizinkan untuk dikumpulkan? Tentang siapa? Siapa yang harus memiliki akses ke data ini?

Saat mengumpulkan data dalam jumlah besar, kemungkinan informasi pribadi yang sensitif dimasukkan dalam kumpulan data itu tinggi. Ini bermasalah, bahkan ketika peretas dan pencuri tidak bermain. Bagaimanapun, data sensitif privasi dapat disalahgunakan oleh siapa pun dengan niat buruk. Ini termasuk perusahaan dan organisasi (jahat).

Analisis data buruk

Banyak perusahaan dan organisasi mengumpulkan data besar, karena mereka dapat menggunakannya untuk analisis yang menarik. Ini mungkin memberi mereka wawasan baru yang penting tentang apa pun yang mereka teliti (seperti, misalnya, kebiasaan konsumen). Pada gilirannya, wawasan dan kesimpulan ini dapat diterjemahkan menjadi perubahan dalam perusahaan yang menghasilkan margin lebih tinggi dan lebih banyak keuntungan. Namun, seperti halnya dataset normal lainnya, analisis big data yang salah dapat memiliki konsekuensi serius. Bagaimanapun, analisis yang tidak tepat dapat dengan mudah menyebabkan kesimpulan yang salah. Ini pada gilirannya dapat diterjemahkan ke tindakan yang tidak efektif atau bahkan kontraproduktif yang diambil.

Mengumpulkan data yang “salah”

Data besar menjadi semakin populer dan organisasi semakin bersedia untuk mengumpulkan semua jenis data. Ini berarti sejumlah besar data dikumpulkan tanpa ada alasan yang jelas untuk menganalisisnya. Dengan kata lain, itu menciptakan database besar informasi mentah yang telah dikumpulkan untuk berjaga-jaga. Perusahaan mungkin berpikir itu cukup mudah untuk mengumpulkan semua data itu, jadi mereka mungkin juga melakukannya. Tidak perlu dikatakan, ini tidak baik untuk privasi siapa pun. Bahkan dapat menyebabkan data yang tidak relevan atau “salah” dikumpulkan dan dianalisis. Jika kesimpulan yang diambil dari analisis ini digunakan dalam manajemen, itu bisa mengarah pada langkah-langkah yang sama tidak efektif yang disebutkan dalam paragraf sebelumnya..

Mengumpulkan dan menyimpan data besar dengan niat buruk

Pengumpulan data besar semakin sering digunakan oleh perusahaan, organisasi dan pemerintah sehingga mereka dapat membuat profil individu yang akurat pada orang. Pengguna atau warga negara hampir tidak pernah diberitahu tentang data pribadi mana yang sedang didaftarkan, apalagi mengapa dan bagaimana. Tidak perlu dikatakan, ini memiliki implikasi serius bagi privasi online mereka. Semua yang mereka lakukan online, dapat disimpan dan dilihat kemudian. Selain itu, pengumpul data besar dapat dengan mudah memengaruhi dan memanipulasi pengambilan keputusan orang dengan menganalisis dan menggunakan data yang dikumpulkan.

Data besar dan privasi

Smartphone dengan gambar telingaSeperti yang mungkin sudah Anda pahami sekarang, data besar hadir dengan banyak kelemahan dan risiko. Namun demikian, banyak perusahaan dan organisasi masih mengumpulkan data dalam skala besar, sebagian besar karena cara itu dapat membantu mereka tumbuh dan berkembang. Mengumpulkan data besar lebih mudah dari sebelumnya. Ini memiliki konsekuensi besar bagi privasi kami. Kami sudah membahas secara singkat kemungkinan bahaya privasi pihak jahat yang mengumpulkan data buruk. Karena privasi kami terkait erat dengan pengumpulan massal data pribadi, kami ingin menggunakan bagian ini untuk membahas berbagai masalah privasi yang menyertai data besar.

Pengumpulan data skala besar

Banyak perusahaan, termasuk Google, Facebook dan Twitter, sangat bergantung pada iklan untuk menopang diri mereka sendiri dan menghasilkan keuntungan. Untuk membuat iklan ini seefektif mungkin, perusahaan-perusahaan ini membuat profil rinci tentang pengguna mereka, terutama dengan mempertimbangkan suka dan minat mereka. Ini adalah bentuk data besar. Demikian juga, pemerintah dan dinas rahasia juga bergantung pada data besar. Mereka menggunakan sejumlah besar informasi ini untuk melacak dan menyelidiki orang-orang yang mereka anggap mencurigakan. Tentu saja, ini juga berarti ada banyak data besar bagi penjahat cyber untuk mendapatkan tangan mereka dan mungkin bahkan memanipulasi dan menyalahgunakan. Ini dapat menciptakan segala macam masalah privasi dan masalah terkait identitas. Salah satu yang terlintas dalam pikiran, adalah pencurian identitas.

Namun, kemungkinan yang datang dengan koleksi di basis data jauh lebih luas dari ini. Saat ini, teknologi telah menjadi sangat canggih dan “pintar” sehingga dapat menggabungkan set data. Ini bisa dilakukan dengan cara yang begitu pintar dan cerdik, sehingga perusahaan besar dan organisasi mungkin tahu lebih banyak tentang Anda daripada Anda! Siapa Anda, di mana Anda tinggal, apa hobi Anda, siapa teman-teman Anda: tidak ada informasi ini akan menjadi pribadi lagi. Bukan pikiran yang sangat menghibur, Anda mungkin berpikir. Untungnya, ada beberapa cara untuk melindungi diri Anda dari pelanggaran privasi skala besar yang dapat disebabkan oleh data besar.

Undang-undang tentang privasi

Cookie di layarUndang-undang dan peraturan privasi dapat melindungi kita dari pelanggaran privasi, tetapi hanya sampai batas tertentu. Untuk membuat masalah menjadi lebih rumit, undang-undang privasi seringkali sangat berbeda antara negara dan wilayah yang berbeda. Misalnya, di Eropa undang-undang privasi konsumen yang relatif ketat yang disebut Peraturan Perlindungan Data Umum (GDPR) berlaku. Undang-undang ini berlaku untuk semua negara anggota UE, meskipun detailnya mungkin berbeda per negara. Banyak perusahaan internasional telah memutuskan untuk mematuhi semua bisnis mereka kepada GDPR. Inilah sebabnya Google, misalnya, sekarang memungkinkan pengguna untuk meminta penghapusan informasi pribadi. Namun, undang-undang privasi di Amerika Serikat berbeda dari satu negara ke negara lain dan tidak melindungi konsumen serta UE. Sayangnya, ini bahkan berlaku untuk undang-undang privasi terberat di AS, Undang-Undang Privasi Konsumen California.

Singkatnya, tidak ada hukum privasi “global” yang kuat yang berlaku untuk semua pengumpul data besar dan melindungi semua pengguna. Ini berarti privasi kami tidak hanya dirugikan oleh pengumpul data besar secara ilegal, tetapi bahkan dengan cara yang sepenuhnya legal, seadoksik mungkin. Untungnya, pelanggaran privasi berskala besar yang diungkapkan oleh whistle blower seperti Edward Snowden dan Chelsea Manning telah meningkatkan kesadaran akan risiko data besar. Tentu saja, ini hanya langkah pertama dalam meningkatkan undang-undang privasi saat ini.

Banyak pengguna internet tidak mau menunggu peningkatan dalam hukum privasi – dan memang seharusnya begitu. Sebaliknya, mereka ingin mengambil tindakan sendiri dengan melakukan apa saja untuk melindungi privasi mereka. Apakah Anda ingin menghindari menjadi bagian dari kumpulan data besar yang tak terhitung jumlahnya juga? Ada beberapa tips dan trik untuk membantu Anda dalam perjalanan.

Cara menjaga data Anda agar tidak disimpan dalam kumpulan data besar

Kumpulan data besar secara serius memengaruhi privasi dan keamanan Anda. Kumpulan data ini mungkin berisi segala macam informasi (pribadi), yang dapat disalahgunakan oleh perusahaan besar atau bahkan penjahat cyber. Itu sebabnya Anda harus selalu memastikan untuk meninggalkan jejak online sesedikit mungkin. Kiat-kiat berikut dapat membantu Anda mencapai ini:

  • Cobalah untuk meminimalkan penggunaan informasi pribadi Anda saat membuat kata sandi atau secara umum di web. Misalnya: hindari menggunakan nama, alamat, nomor telepon, tanggal lahir, dan sebagainya.
  • Selalu ingat yang berikut ini: semua yang Anda publikasikan di internet, akan selalu ada di sana selamanya. Ini mungkin tidak selalu benar sepenuhnya, tetapi tingkat kehati-hatian ini membantu menjaga privasi Anda. Anda akan secara otomatis menangani data pribadi Anda dengan lebih hati-hati begitu Anda menyadari fakta ini.
  • Pastikan koneksi internet Anda aman dan dianonimkan, misalnya dengan menggunakan Tor-browser atau VPN misalnya.
  • Gunakan satu atau beberapa pemblokir iklan di browser Anda.
  • Gunakan pada atau lebih banyak plug-in browser yang memblokir pelacak dan cookie.
  • Kosongkan cache Anda secara teratur dan hapus riwayat penelusuran dan cookie Anda.
  • Logout dari situs web ketika Anda tidak menggunakannya secara aktif.

Mengambil langkah-langkah ini adalah awal yang baik untuk menjaga privasi dan keamanan online Anda. Perlu diingat, bagaimanapun, bahwa data besar dikumpulkan dalam berbagai cara – tidak hanya online. Singkatnya, di mana pun Anda berada dan apa pun yang Anda lakukan, Anda harus selalu waspada dan berusaha melindungi data (pribadi) Anda dari pengumpul data besar.

Kim Martin Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map