Büyük veri ve gizlilik: Gizlilik riskleri nelerdir? | VPNOverview

Son birkaç on yılda dünya, özellikle BT söz konusu olduğunda, birçok açıdan büyük ölçüde değişti. Günlük olarak iletişim kurabildiğimiz insanların sayısı, tıpkı erişebildiğimiz bilgi miktarı gibi, muazzam bir şekilde arttı. Ancak aynı şey, büyük şirketlerin bizim hakkımızda topladığı bilgi miktarı için de geçerlidir. Büyük veri gibi terimler zaman geçtikçe daha sık kullanılır. Ama bu tam olarak ne anlama geliyor? Büyük veri nedir? Bu tehlikeli mi? Gizliliğimizi nasıl etkiler? Bunlar bu makalede ele alacağımız bazı sorular.


Büyük veri nedir?

Büyüteçli liste“Büyük veri” terimi, farklı aktörler tarafından sürekli olarak toplanan muazzam miktarlarda (kişisel) veriyi tanımlar. Örnek olarak, Google’ın kullanıcılarının arama sorguları hakkında topladığı bilgiler verilebilir. Büyük veri olgusu, Facebook, Google ve çoğu hükümet gibi (büyük) şirketler ve kuruluşlar, kullanıcıları, müşterileri ve vatandaşları hakkında eskisinden daha fazla veri toplamaya başladığı için nispeten yeni bir gelişme. Yeni teknolojiler, sayısallaştırılmış bir dünya ve internet bu gelişmeye son derece yardımcı oldu.

Büyük veri koleksiyonları o kadar geniştir ki, geleneksel veri analizi kullanarak bunları analiz etmek imkansızdır. Bununla birlikte, eğer büyük veriler doğru bir şekilde analiz edilirse, ilginç modeller ve sonuçlar ortaya çıkabilir. Örneğin, büyük veri genellikle büyük ölçekli pazar araştırması için kullanılır: hangi ürünlerin satın alınması daha olasıdır? Müşterilere ulaşmak ve onları ikna etmek istediğinizde en etkili reklam türü hangisidir??

Bir veri kümesinin büyük veri olarak kabul edilebilmesi için genellikle aşağıdaki üç kriteri karşılaması gerekir: 3 v’ler:

  • Ses: Büyük veri küçük bir örneklemden başka bir şey değildir. Uzun, sürekli gözlemden kaynaklanan geniş veri toplamalarını içerir.
  • Hız: Bu, büyük verilerin toplandığı etkileyici hızlarla ilgilidir. Dahası, büyük verilere genellikle gerçek zamanlı olarak erişilebilir (toplandığı için).
  • Çeşitlilik: Büyük veri kümeleri genellikle birçok farklı türde bilgi içerir. Büyük veri kümelerindeki veriler, boşlukları doldurmak ve veri kümesini daha da eksiksiz hale getirmek için birleştirilebilir.

Bu 3’lerin yanı sıra, büyük verilerin başka özellikleri de vardır. Örneğin, büyük veriler makine öğrenimi için harikadır. Bu, bilgisayarlara ve makinelere belirli görevleri öğretmek için etkili bir şekilde kullanılabileceği anlamına gelir. Ayrıca, daha önce kısaca değindiğimiz gibi, kalıpları tespit etmek için büyük veriler kullanılabilir. Bu çoğunlukla veriler üzerinde çalışan bilgisayarlar aracılığıyla çok etkili bir şekilde gerçekleşir. Son olarak, büyük veri kullanıcıların dijital parmak izlerinin yansımasıdır. Bu, insanların dijital ve çevrimiçi etkinliklerinin bir yan ürünü olduğu ve bireysel kişisel profiller oluşturmak için kullanılabileceği anlamına gelir.

Farklı türde büyük veri

Büyük verileri sınıflandırmanın farklı yolları vardır. En sık kullanılan ilk yöntem, büyük verileri toplanan veri türüne göre ayırır. Bu tür sınıflandırma için kullanılan üç olası kategori şunlardır: yapılandırılmış büyük veri, yapılandırılmamış büyük veri ve yarı yapılandırılmış büyük veri.

  1. Yapılandırılmış: Büyük veriler yapılandırıldığında, kaydedilebilir ve organize ve mantıklı bir şekilde sunulabilir, böylece veriler daha erişilebilir ve daha kolay anlaşılır hale gelir. Örnek olarak, bir şirket tarafından oluşturulan müşteri adreslerinin bir listesi verilebilir. Bu listede, büyük olasılıkla müşterilerin adları, adresleri ve telefon numaraları gibi tümü, örneğin bir grafik veya tabloda açıkça yapılandırılmış diğer ayrıntılar bulunur.
  2. yapılandırılmamış: Yapılandırılmamış büyük veriler hiç organize değildir. Ortalama bir insan için anlamlı olacak mantıklı bir sunumdan yoksundur. Yapılandırılmamış büyük veriler, örneğin, veri kümesinin farklı öğeleri arasında belirli bir tutarlılığı gösteren bir tablo yapısına sahip değildir. Bu nedenle bu tür verilerin gezinmesi ve anlaşılması oldukça zordur. Birçok veri kümesi başlangıçta yapılandırılmamış büyük veri olarak başlar.
  3. Yarı yapılandırılmış: Tahmin edebileceğiniz gibi yarı yapılandırılmış büyük veriler, hem yapılandırılmış hem de yapılandırılmamış büyük verilerin özelliklerine sahiptir. Bu tür verilerin niteliği ve temsili tamamen keyfi değildir. Yine de anlamlı bir analiz için kullanılacak kadar yapılandırılmamış ve organize edilmemiştir. Örneğin, belirli meta veri etiketlerini (metinde doğrudan görünmeyen ek bilgiler), örneğin belirli anahtar kelimeleri içerdiği bir web sayfası olabilir. Bu etiketler, bir sayfanın yazarı veya çevrimiçi yerleştirildiği an gibi belirli bilgi parçalarını etkili bir şekilde gösterir. Metnin kendisi esasen yapılandırılmamıştır, ancak içerdiği anahtar kelimeler ve diğer meta veriler, onu analiz için biraz uygun bir temel haline getirmeye yardımcı olur.

Büyük verinin kaynağına dayalı sınıflandırma

Farklı büyük veri türlerini ayırt etmenin bir başka yaygın yolu da verinin kaynağına bakmaktır. Bilgileri kim veya ne oluşturdu? Önceki sapma gibi, bu sınıflandırma yöntemi de 3 farklı kategoriden oluşur.

  1. İnsanlar: Bu kategori insanlar tarafından üretilen büyük verilerle ilgilidir. Örnek olarak kitaplar, resimler, videolar, web siteleri ve Facebook, Twitter, Instagram gibi sosyal medyadaki bilgi ve (kişisel) veriler verilebilir..
  2. İşlem kaydı: Bu kategori, bir işletmedeki belirli süreçleri iyileştirmek için (büyük) şirketler tarafından toplanan ve analiz edilen daha geleneksel türde büyük verileri içerir.
  3. makineler: Bu tür büyük veriler, makinelere yerleştirilen ve gittikçe artan sayıda sensörden kaynaklanmaktadır. Bir örnek, genellikle bilgisayar işlemcilerinde yerleşik olarak bulunan ısı sensörüdür. Makineler tarafından üretilen veriler genellikle çok karmaşık olabilir, ancak en azından bu tür büyük veriler genellikle iyi yapılandırılmış ve eksiksizdir.

Büyük veriler ne için kullanılabilir??

Facebook logosuŞimdiye kadar tartışılan her şey biraz soyut gelebilir. İşleri biraz daha somut hale getirelim ve büyük verilerin gerçek hayattaki bazı uygulamalarını tartışalım. Sonuçta, şirketlerin ve kuruluşların büyük veri kullanma yöntemleri vardır. Akla gelen ilk şeylerden biri, şirketlerin bizim hakkımızda topladığı çok büyük miktarda veri. Facebook tüm kullanıcılarına veri toplar ve bunu zaman çizelgenizde ne göstereceğinize karar vermek için analiz eder. Tabii ki, bu kişisel istek ve ilgi alanlarınıza hitap etmek için yapılır. Facebook, bunun web sitelerinde daha uzun süre kalmanızı umuyor. Buna karşılık Amazon, müşterileri ve satın aldıkları ürünler hakkında bilgi toplar. Bu şekilde Amazon, ilginizi çekeceğini düşündükleri ürünleri önerebilir ve kazançlarını bu şekilde artırabilir.

Ancak, büyük veriler de yukarıda açıklanan ticari stratejilerden tamamen farklı şekillerde kullanılmaktadır. Örneğin, toplu taşıma şirketleri belirli rotaların ne kadar meşgul oldukları hakkında veri toplayabilir. Daha sonra, örneğin hangi güzergahların ek otobüs veya tren gerektirdiğine karar vermek için bu verileri analiz edebilirler. Büyük verilerin etkili kullanımının bir başka iyi bilinen durumu, uluslararası dağıtım devi UPS ile ilgilidir. UPS, büyük veri analizinden sonra geliştirilen özel bir yazılım kullanır. Bu yazılım, UPS sürücülerinin daha pahalı, daha israflı ve sağa dönüşlerden daha tehlikeli olan sola dönüşlerden kaçınmasına yardımcı olur. Sözde, bu sistem büyük veriler sayesinde UPS’e milyonlarca galon yakıt tasarrufu sağlamıştır..

Büyük veri toplamanın ilginç bir başka örneği DNA testleri ve MyHeritage DNA gibi web siteleridir. Bu web sitesi, basit bir DNA testi ile “etnik kökenlerinizi ortaya çıkarmanıza ve yeni akrabalar bulmanıza” yardımcı olabileceğini iddia ediyor. Söylemeye gerek yok, bu süreç çok fazla veri toplama ve çapraz referanslama içeriyor ve bu da onu büyük veri toplama ve kullanımda önemli bir oyuncu haline getiriyor. “Geleneksel” fiziksel DNA testleri de büyük miktarda büyük veri içerir, çünkü bu testleri yapan şirketler birçok insan hakkında son derece büyük veri setleri kazanacaktır. Tabii ki, bu büyük veri toplama süreçleriyle birlikte gelebilecek olası risklerin farkında olmak önemlidir. Bu riskler bu makalenin bir sonraki bölümünde vurgulanacaktır.

Büyük veriler tehlikeli midir??

Yukarıda gösterildiği gibi, büyük veriler birçok durumda inanılmaz derecede faydalı olabilir. Bize süreçleri kolaylaştırmak ve şirketleri daha verimli ve karlı hale getirmek için kullanabileceğimiz tonlarca bilgi sağlar. Ancak bu, büyük veri toplamak ve kullanmak tamamen risksiz olduğu anlamına gelmez. Büyük verilerle ortaya çıkan beş önemli risk vardır. Burada beşinin hepsini tartışacağız.

Hackerlar ve hırsızlar

Çevrimiçi yaptığımız her şeyle birlikte, kişisel verilerimizin ve internet faaliyetlerimizle ilgili bilgilerimizin çalınması riski doğar. Her internet kullanıcısı bunun farkında olmalıdır. Son birkaç yılda veri sızıntısı ve hırsızlık sayısı önemli ölçüde artmıştır. Haberlerde genellikle, parola içeren veri kümeleri satan ve karanlık web gibi yerlerle ilgili diğer bilgileri satan suçlular hakkında hikayeler var. Genellikle, bu veri setleri resmi web sitelerinden, şirketlerden ve kuruluşlardan çalınır. Bu veri setleri büyüdükçe, hırsızların bunları elde etmeleri daha ilginç hale gelir. Ellerini bu veri kümelerine alırlarsa, birçok soruna neden olabilirler. Söylemeye gerek yok, bu da gizliliğinizden büyük ölçüde ödün verebilir.

Gizlilik

Kişisel veri toplama uygulaması gittikçe yaygınlaşmaktadır. Bununla birlikte, mevcut gizlilik düzenlemeleri bu uygulamayı mümkün kılan teknolojideki hızlı gelişmelere ayak uyduramaz. Bu, yasalara bakarak çözülemeyen gri alanlar ve belirsizlikler için alan bırakır. Ortaya çıkan önemli gizlilik endişeleri şunları içerir: Ne tür verilerin toplanmasına izin verilir? Kimin hakkında? Bu verilere kimler erişebilir??

Büyük miktarda veri toplarken, hassas kişisel bilgilerin bu veri kümelerine dahil edilmesi ihtimali yüksektir. Bilgisayar korsanları ve hırsızlar oyunda olmasa bile bu sorunludur. Sonuçta, gizliliğe duyarlı veriler kötü niyetli herkes tarafından kötüye kullanılabilir. Buna (kötü amaçlı) şirketler ve kuruluşlar dahildir.

Kötü veri analizi

Birçok şirket ve kuruluş büyük veri toplar, çünkü ilginç analizler için kullanabilirler. Bu onlara araştırdıkları şey hakkında önemli yeni bilgiler verebilir (örneğin, tüketici alışkanlıkları). Buna karşılık, bu içgörüler ve sonuçlar şirket içinde daha yüksek marjlar ve daha fazla kâr sağlayan değişikliklere dönüşebilir. Bununla birlikte, diğer normal veri kümelerinde olduğu gibi, büyük verilerin yanlış bir analizinin ciddi sonuçları olabilir. Sonuçta, yanlış bir analiz kolayca yanlış sonuçlara yol açabilir. Bunlar da sonuç olarak alınan etkisiz ve hatta karşı üretken önlemlere dönüşebilir.

“Yanlış” veri toplama

Büyük veri giderek daha popüler hale geliyor ve kuruluşlar her türlü veriyi toplamaya daha istekli. Bu, büyük miktarda veriyi analiz etmek için açık bir neden olmadan toplandığı anlamına gelir. Başka bir deyişle, her halükarda toplanan dev bir ham bilgi veritabanı oluşturur. Şirketler muhtemelen tüm bu verileri toplamanın yeterince kolay olduğunu düşünüyorlar, bu yüzden de yapabilirler. Söylemeye gerek yok, bu kimsenin gizliliği için iyi değil. Alakasız veya “yanlış” verilerin toplanmasına ve analiz edilmesine bile yol açabilir. Bu analizden çıkarılan sonuçlar yönetimde kullanılırsa, önceki paragrafta belirtilen aynı etkisiz önlemlere yol açabilir..

Kötü niyetle büyük veri toplama ve kaydetme

Büyük verilerin toplanması şirketler, kuruluşlar ve hükümetler tarafından giderek daha sık kullanılır, böylece insanlar üzerinde doğru bireysel profiller oluşturabilirler. Neden veya nasıl olursa olsun, kullanıcılar veya vatandaşlar kişisel verilerinin hangilerinin kaydedildiği konusunda neredeyse hiç bilgilendirilmezler. Söylemeye gerek yok, bunun çevrimiçi gizlilikleri üzerinde ciddi etkileri var. Çevrimiçi yaptıkları her şey kaydedilebilir ve daha sonra görüntülenebilir. Dahası, büyük veri toplayıcıları toplanan verileri analiz edip kullanarak insanların karar verme süreçlerini kolayca etkileyebilir ve manipüle edebilir.

Büyük veri ve gizlilik

Kulak resmi ile SmartphoneMuhtemelen şimdiye kadar anlayacağınız gibi, büyük veriler birçok dezavantaj ve riskle birlikte gelir. Bununla birlikte, birçok şirket ve kuruluş, büyük ölçüde, büyük ölçüde büyümelerine ve gelişmelerine nasıl yardımcı olabileceğinden dolayı veri toplamaktadır. Büyük veri toplamak hiç olmadığı kadar kolay. Bunun gizliliğimiz için büyük sonuçları var. Zaten kötü veri toplayan kötü niyetli tarafların olası gizlilik tehlikelerini kısaca tartıştık. Gizliliğimiz kişisel verilerin toplu olarak toplanmasına çok bağlı olduğundan, bu bölümü büyük verilerle gelen farklı gizlilik endişelerini tartışmak için kullanmak istiyoruz.

Büyük ölçekli veri toplama

Google, Facebook ve Twitter da dahil olmak üzere birçok şirket, kendilerini korumak ve kâr etmek için büyük ölçüde reklamlara bağımlıdır. Bu reklamları olabildiğince etkili hale getirmek için, bu şirketler kullanıcıları, özellikle beğenilerini ve ilgi alanlarını dikkate alarak ayrıntılı profiller oluşturur. Bu bir tür büyük veri. Aynı şekilde, hükümetler ve gizli servisler de büyük verilere bağımlıdır. Şüpheli gördükleri insanları izlemek ve araştırmak için bu büyük miktarda bilgiyi kullanıyorlar. Tabii ki, bu aynı zamanda siber suçlular için ellerini ele geçirmek ve hatta manipüle etmek ve kötüye kullanmak için birçok büyük veri olduğu anlamına gelir. Bu, gizlilik ve kimlikle ilgili her türlü sorunu yaratabilir. Akla gelen, kimlik hırsızlığı.

Yine de, veritabanlarındaki koleksiyonla birlikte gelen olanaklar bundan çok daha geniştir. Günümüzde teknoloji, veri kümelerini birleştirebilecek kadar gelişmiş ve “akıllı” hale geldi. Bu, o kadar akıllı ve kurnaz bir şekilde yapılabilir ki, büyük şirketler ve kuruluşlar muhtemelen sizinle ilgili sizden daha çok şey bilir! Siz kimsiniz, nerede yaşıyorsanız, hobileriniz nelerdir, arkadaşlarınız kimlerdir: bu bilgilerin hiçbiri artık gizli olmayacak. Çok rahatlatıcı bir düşünce değil, düşünebilirsiniz. Neyse ki, kendinizi büyük verilerin neden olabileceği büyük ölçekli gizlilik ihlallerinden korumanın bazı yolları vardır.

Gizlilik yasaları

Ekrandaki çerezlerGizlilik yasaları ve düzenlemeleri, gizlilik ihlallerine karşı bizi koruyabilir, ancak yalnızca bir dereceye kadar. Konuları daha karmaşık hale getirmek için, gizlilik yasaları genellikle farklı ülkeler ve bölgeler arasında büyük farklılıklar gösterir. Örneğin, Avrupa’da Genel Veri Koruma Yönetmeliği (GDPR) adı verilen nispeten katı bir tüketici gizliliği yasası yürürlüktedir. Bu yasa tüm AB üye ülkeleri için geçerlidir, ancak ayrıntılar ülkeden ülkeye değişebilir. Birçok uluslararası şirket, tüm işlerini GSYİH’ye uymaya karar vermiştir. Örneğin, Google şimdi kullanıcıların kişisel bilgilerin silinmesini istemesine izin veriyor. Bununla birlikte, Amerika Birleşik Devletleri’ndeki gizlilik yasaları eyaletten eyalete farklılık gösterir ve tüketicileri ve AB’yi korumaz. Ne yazık ki, bu ABD’deki en zorlu gizlilik yasası olan Kaliforniya Tüketici Gizlilik Yasası için bile geçerlidir.

Kısacası, tüm büyük veri toplayıcıları için geçerli olan ve tüm kullanıcıları koruyan güçlü bir “küresel” gizlilik yasası diye bir şey yoktur. Bu, gizliliğimizin sadece büyük veri toplayıcıları tarafından yasadışı değil, aynı zamanda kulağa geldiği kadar paradoksal olduğu gibi tamamen yasal yollarla da zarar verdiği anlamına gelir. Neyse ki, Edward Snowden ve Chelsea Manning gibi düdük üfleyicilerin maruz kaldığı büyük ölçekli gizlilik ihlalleri, büyük verilerin riskleri konusundaki farkındalığı büyük ölçüde artırdı. Tabii ki, bu mevcut gizlilik yasalarını geliştirmenin sadece ilk adımı.

Birçok internet kullanıcısı gizlilik yasalarında bir iyileşme beklemek istemez – ve haklı olarak. Daha ziyade, gizliliklerini korumak için ellerinden geleni yaparak kendileri harekete geçmek istiyorlar. Sayısız büyük veri setinin parçası olmaktan kaçınmak ister misiniz? Size yardımcı olacak birkaç ipucu ve püf noktası var.

Verilerinizin büyük veri kümelerine kaydedilmesini engelleme

Büyük veri kümeleri gizliliğinizi ve güvenliğinizi ciddi şekilde etkiler. Bu veri kümeleri, büyük şirketler ve hatta siber suçlular tarafından kötüye kullanılabilecek her türlü (kişisel) bilgi içerebilir. Bu yüzden her zaman mümkün olduğunca az çevrimiçi iz bıraktığınızdan emin olmalısınız. Aşağıdaki ipuçları bunu başarmanıza yardımcı olabilir:

  • Parola oluştururken veya genel olarak web’de kişisel bilgilerinizin kullanımını en aza indirmeye çalışın. Örneğin: adınızı, adresinizi, telefon numaranızı, doğum tarihinizi vb. Kullanmaktan kaçının..
  • Her zaman aşağıdakileri unutmayın: İnternette yayınladığınız her şey sonsuza dek orada olacaktır. Bu her zaman tam olarak doğru olmayabilir, ancak bu dikkat uyarısı gizliliğinizin korunmasına yardımcı olur. Bu gerçeğin farkında olduğunuzda özel verilerinizi otomatik olarak daha dikkatli bir şekilde ele alacaksınız.
  • Örneğin Tor tarayıcı veya VPN kullanarak internet bağlantınızın güvenli ve anonim olduğundan emin olun.
  • Tarayıcınızda bir veya birkaç reklam engelleyici kullanın.
  • İzleyicileri ve çerezleri engelleyen veya daha fazla tarayıcı eklentisi kullanın.
  • Önbelleğinizi düzenli olarak temizleyin ve tarama geçmişinizi ve çerezlerinizi silin.
  • Aktif olarak kullanmadığınızda web sitelerinden çıkış yapın.

Çevrimiçi gizliliğinizi ve güvenliğinizi korumak söz konusu olduğunda bu adımları uygulamak iyi bir başlangıçtır. Ancak, büyük verilerin yalnızca çevrimiçi değil birçok farklı şekilde toplandığını unutmayın. Kısacası, nerede olursanız olun ve ne yaparsanız yapın, daima uyanık olmalısınız ve (kişisel) verilerinizi büyük veri toplayıcılardan korumaya çalışmalısınız..

Kim Martin
Kim Martin Administrator
Sorry! The Author has not filled his profile.
follow me