נתונים גדולים ופרטיות: מהם סיכוני הפרטיות? | VPNOverview

בעשורים האחרונים העולם השתנה מאוד מבחינות רבות, במיוחד כשמדובר ב- IT. מספר האנשים שאנו מצליחים לתקשר איתם על בסיס יומי גדל מאוד, ממש כמו כמות המידע שיש לנו גישה אליהם. עם זאת, הדבר נכון גם לכמות המידע שחברות גדולות אוספות עלינו. מונחים כמו נתונים גדולים משמשים לעתים קרובות יותר ככל שעובר הזמן. אבל מה זה אומר בדיוק? מה זה נתונים גדולים? זה מסוכן? איך זה משפיע על הפרטיות שלנו, אם בכלל? אלה כמה מהשאלות שנעסוק במאמר זה.


מה זה נתונים גדולים?

רשימה עם זכוכית מגדלתהמונח “נתונים גדולים” מתאר את הכמויות האדירות של נתונים (אישיים) הנאספים ברציפות על ידי שחקנים שונים. דוגמה לכך היא כל המידע שגוגל אוספת על שאילתות החיפוש של המשתמשים שלה. תופעת הנתונים הגדולים היא פיתוח יחסית יחסית שהתחיל מכיוון שחברות וארגונים (גדולים), כמו פייסבוק, גוגל ורוב הממשלות, החלו לאסוף נתונים רבים יותר על המשתמשים, לקוחותיה ואזרחיה מבעבר. טכנולוגיות חדשות, עולם דיגיטלי והאינטרנט סייעו להתפתחות זו מאוד.

אוספים של נתונים גדולים הם לרוב כה גדולים עד כי אי אפשר לנתח אותם באמצעות ניתוח נתונים מסורתי. עם זאת, אם מנתחים נתונים גדולים בדרך הנכונה, ניתן להפיק דפוסים ומסקנות מעניינות. לדוגמה, נתונים גדולים משמשים לרוב למחקרי שוק בהיקפים גדולים: אילו מוצרים הם ככל הנראה לרכוש? איזה סוג פרסום הוא היעיל ביותר כשרוצים להגיע ולשכנע לקוחות?

על מנת שמערכת נתונים תיחשב כנתונים גדולים, היא בדרך כלל צריכה לעמוד בשלושת הקריטריונים הבאים, הידועים גם בשם 3 v:

  • כרך: נתונים גדולים הם רק מדגם קטן. זה כרוך באוספים עצומים של נתונים, הנובעים מהתבוננות ארוכה ורציפה.
  • מהירות: זה קשור למהירויות המרשימות בהן נאספים נתונים גדולים. יתר על כן, לעתים קרובות נתונים גדולים נגישים בזמן אמת (בזמן שהם נאספים).
  • מגוון: מערכי נתונים גדולים מכילים לרוב סוגים רבים של מידע. ניתן אפילו לשלב נתונים בתוך מערכי נתונים גדולים כדי למלא פערים ולהפוך את מערך הנתונים למושלם יותר.

מלבד שלושת ה- V, נתונים גדולים הם בעלי מאפיינים אחרים. לדוגמה, נתונים גדולים זה נהדר ללימוד מכונה. משמעות הדבר היא שניתן להשתמש בו ביעילות ללמד מחשבים ומכונות משימות מסוימות. יתר על כן, כפי שכבר נגענו בקצרה, ניתן להשתמש בנתונים גדולים כדי לאתר דפוסים. זה קורה לרוב בצורה יעילה מאוד, באמצעות מחשבים העובדים על הנתונים. לבסוף, נתונים גדולים הם שיקוף של טביעות האצבע הדיגיטליות של המשתמשים. משמעות הדבר היא תוצר לוואי של פעילויות דיגיטליות ואונליין של אנשים וניתן להשתמש בו לבניית פרופילים אישיים אישיים.

סוגים שונים של נתונים גדולים

ישנן דרכים שונות לסווג נתונים גדולים. הדרך הראשונה, המשמשת בתדירות הגבוהה ביותר, מבדילה נתונים גדולים על פי סוג הנתונים שנאספים. שלוש הקטגוריות האפשריות המשמשות לסוג זה של סיווג הן: נתונים גדולים מובנים, נתונים גדולים ולא מובנים ונתונים גדולים מובנים למחצה.

  1. מובנים: כאשר נתונים גדולים מובנים, ניתן לשמור אותם ולהציג בצורה מסודרת והגיונית, מה שהופך את הנתונים לנגישים וקלים יותר להבנה. דוגמא לכך היא רשימת כתובות לקוחות שנוצרה על ידי חברה. ברשימה זו, ככל הנראה, ניתן למצוא שמות של לקוחות, כתובות ואולי פרטים אחרים כמו מספרי טלפון, כולם מובנים בבירור, למשל בתרשים או בטבלה..
  2. לא מובנה: נתונים גדולים שאינם מובנים אינם מסודרים כלל. הוא חסר מצגת הגיונית שתעשה היגיון בבני האדם הממוצע. נתונים גדולים לא מובנים אינם כוללים את המבנה של, למשל, טבלה המציינת קוהרנטיות מסוימת בין האלמנטים השונים של מערך הנתונים. מכאן שסוג נתונים זה קשה למדי לניווט ולהבנה. מערכי נתונים רבים מתחילים בתחילה כנתונים גדולים לא מובנים.
  3. מובנה למחצה: נתונים גדולים מובנים למחצה, כפי שאפשר לנחש, הם בעלי מאפיינים של נתונים גדולים ומובנים כאחד. האופי והייצוג של נתונים מסוג זה אינם שרירותיים לחלוטין. עם זאת, הוא גם לא מובנה ומסודר כדי לשמש לניתוח משמעותי. דוגמה לכך היא עמוד אינטרנט המכיל תגי מטא ספציפיים (מידע נוסף שאינו גלוי ישירות בטקסט), למשל מכיוון שהוא מכיל מילות מפתח מסוימות. תגיות אלה מציגות ביעילות פיסות מידע ספציפיות, כמו כותב דף או הרגע בו הוצב ברשת. הטקסט עצמו למעשה לא מובנה, ובכל זאת מילות המפתח ונתוני המטא האחרים שהוא מכיל עוזרים להפוך אותו לבסיס מתאים למדי לניתוח.

סיווג מבוסס על מקור הנתונים הגדולים

דרך נפוצה נוספת להבדיל בין סוגים שונים של נתונים גדולים היא התבוננות במקור הנתונים. מי או מה הפיק את המידע? כמו ההמצאה הקודמת, גם שיטת סיווג זו מורכבת משלוש קטגוריות שונות.

  1. אנשיםקטגוריה זו נוגעת לנתונים גדולים שנוצרים על ידי אנשים. דוגמאות לכך הן ספרים, תמונות, סרטונים וכן מידע ונתונים (אישיים) באתרים ומדיה חברתית, כמו פייסבוק, טוויטר, אינסטגרם וכן הלאה..
  2. רישום לתהליך: קטגוריה זו כוללת את סוג ה- Big Data המסורתי יותר, שנאסף ומנותח על ידי חברות (גדולות) כדי לשפר תהליכים מסוימים בעסק..
  3. מכונות: סוג זה של נתונים גדולים נובע מהמספר ההולך וגדל של חיישנים המוצבים במכונות. דוגמא לכך היא חיישן החום המובנה לעיתים קרובות במעבדי מחשבים. הנתונים שנוצרים על ידי מכונות יכולים לרוב להיות מורכבים מאוד, אבל לפחות נתונים גדולים מסוג זה הם בדרך כלל מובנים ושלמים.

לשם מה ניתן להשתמש בנתונים גדולים?

סמל פייסבוקכל מה שנדון עד כה עשוי להישמע מעט מופשט. בואו נהיה דברים קצת יותר קונקרטיים ונדון בכמה יישומים בחיים האמיתיים של נתונים גדולים. אחרי הכל, ישנן הרבה דרכים בהן חברות וארגונים משתמשים בנתונים גדולים. אחד הדברים הראשונים שעולים בראש הוא הכמויות העצומות של חברות נתונים שמאספות עלינו. פייסבוק אוספת נתונים על כל משתמשיה ומנתחת זאת כדי להחליט מה להראות לך על ציר הזמן שלך. כמובן שזה נעשה כדי לספק את רצונכם האישיים והאינטרסים שלכם. פייסבוק מקווה שזה יביא אותך להישאר באתר שלהם לפרקי זמן ארוכים יותר. בתורו אמזון אוספת מידע על לקוחותיה ועל המוצרים שהם קונים. ככה אמזון יכולה להמליץ ​​על מוצרים שהם חושבים שתתעניינו בהם ולהגדיל את הרווחים שלהם בדרך זו.

עם זאת, משתמשים בנתונים גדולים גם בדרכים שונות לחלוטין מהאסטרטגיות המסחריות שתוארו לעיל. לדוגמה, חברות תחבורה ציבורית יכולות לאסוף נתונים על עד כמה עסוקים במסלולי נסיעה מסוימים. לאחר מכן הם יכלו לנתח נתונים אלה כדי להחליט, למשל, אילו מסלולים דורשים אוטובוסים או רכבות נוספות. מקרה ידוע נוסף של שימוש יעיל במידע גדול נוגע לענקית המסירה הבינלאומית UPS. UPS משתמשת בתוכנה מיוחדת אשר פותחה לאחר ניתוח נתונים גדולים. תוכנה זו מסייעת לנהגי UPS להימנע מפניות שמאל, אשר יקרות יותר, בזבזניות ומסוכנות יותר מפניות ימינה. כביכול, מערכת זו כבר חסכה ל- UPS מיליוני גלונים בדלק, הכל בזכות נתונים גדולים.

דוגמא מעניינת נוספת לאיסוף נתונים גדולים הם בדיקות DNA ואתרי אינטרנט כמו ה- MyHeritage DNA. אתר זה טוען שהוא יכול לעזור לכם “לחשוף את מוצאם האתני ולמצוא קרובי משפחה חדשים” באמצעות בדיקת DNA פשוטה. למותר לציין, שתהליך זה כרוך בהרבה איסוף נתונים והפניות מקושרות, מה שהופך אותו לשחקן מרכזי נוסף באיסוף ושימוש בנתונים גדולים. בדיקות DNA גופניות “מסורתיות” כוללות גם כמות עצומה של נתונים גדולים, מכיוון שחברות שעושות בדיקות אלו יזכו במערכי נתונים גדולים במיוחד על הרבה מאוד אנשים. כמובן שחשוב להיות מודע לסיכונים האפשריים שמופיעים בתהליכי איסוף הנתונים הגדולים האלה. סיכונים אלה מודגשים בחלק הבא של מאמר זה.

האם נתונים גדולים מסוכנים?

כפי שמוצג לעיל, נתונים גדולים יכולים להיות שימושיים להפליא במקרים רבים. זה מספק לנו טונות של מידע בו אנו יכולים להשתמש כדי לייעל תהליכים ולהפוך חברות ליעילות ורווחיות יותר. עם זאת, אין פירושו כי איסוף ושימוש בנתונים גדולים אינו נטול סיכון לחלוטין. ישנם חמישה סיכונים חשובים שמגיעים עם נתונים גדולים. נדבר על כל החמישה כאן.

האקרים וגנבים

עם כל מה שאנו עושים באופן מקוון, ישנו סיכון מובנה כי ניתן לגנוב את המידע האישי והמידע שלנו על פעילויות האינטרנט שלנו. כל משתמש באינטרנט צריך להיות מודע לכך. מספר הדליפות והגניבות של הנתונים גדל באופן דרסטי במהלך השנים האחרונות. חדשות לעיתים קרובות יש סיפורים על פושעים המוכרים מערכי נתונים המכילים סיסמאות ומידע אחר על מקומות כמו האינטרנט האפל. לעיתים קרובות גיליונות נתונים אלה נגנבים מאתרים רשמיים, חברות וארגונים. ככל שמערכות הנתונים הללו גדולות יותר, כך הגנבים מנסים להשיג אותם. אם הם ישימו יד על מערכי הנתונים האלה, הם עלולים לגרום לבעיות רבות. למותר לציין שזה יכול גם לפגוע מאוד בפרטיותך.

פרטיות

התרגול של איסוף נתונים אישיים הופך ונפוץ יותר ויותר. עם זאת, תקנות הפרטיות הנוכחיות אינן יכולות לעמוד בקצב ההתפתחויות המהירות בטכנולוגיה המאפשרת תרגול זה. זה משאיר מקום לאזורים אפורים וחוסר וודאות שלא ניתן לפתור על ידי התבוננות בחוק. דאגות פרטיות חשובות שעולות כוללות: איזה סוג של נתונים מותר לאסוף? על מי? למי צריכה להיות גישה לנתונים אלה?

בעת איסוף כמויות גדולות של נתונים, הסיכוי שמידע אישי רגיש נכלל בערכות הנתונים הללו הוא גבוה. זה בעייתי, גם כאשר האקרים וגנבים אינם משחקים. אחרי הכל, נתונים רגישים לפרטיות יכולים להתעלל בכל מי שיש לו כוונות לא טובות. זה כולל חברות וארגונים (זדוניים).

ניתוח נתונים גרוע

חברות וארגונים רבים אוספים נתונים גדולים, מכיוון שהם יכולים להשתמש בהם לצורך ניתוחים מעניינים. זה עשוי להעניק להם תובנות חדשות וחשובות על כל מה שהם חוקרים (כמו הרגלים צרכניים, למשל). בתורו, תובנות ומסקנות אלה עלולות לתרגם לשינויים בתוך החברה אשר גורמים לשוליים גבוהים יותר ולרווחיות רבה יותר. עם זאת, ממש כמו בכל מערך נתונים רגיל אחר, לניתוח שגוי של נתונים גדולים יכולה להיות השלכות חמורות. אחרי הכל, ניתוח לא ראוי יכול בקלות להוביל למסקנות שגויות. אלה יכולים בתורם לתרגם לאמצעים שאינם יעילים או אפילו למניעת נגד.

איסוף הנתונים “השגויים”

נתונים גדולים הופכים פופולריים יותר ויותר וארגונים מוכנים יותר ויותר לאסוף כל מיני נתונים. המשמעות היא שנאסף כמויות ענקיות של נתונים מבלי שיש סיבה ברורה לנתח אותם. במילים אחרות, זה יוצר מאגר מידע ענק של מידע גולמי שנאסף למקרה. חברות כנראה חושבות שקל די לאסוף את כל הנתונים האלה, כך שהם עשויים לעשות זאת. למותר לציין שזה לא טוב לפרטיותו של אף אחד. זה יכול אפילו להביא לאיסוף ולניתוח של נתונים לא רלוונטיים או “שגויים”. אם משתמשים במסקנות שהושגו מניתוח זה בניהול, הדבר עלול להוביל לאותם אמצעים לא יעילים שהוזכרו בפסקה הקודמת.

איסוף ושמירת נתונים גדולים בכוונות לא טובות

אוסף נתונים גדולים משמש לעיתים קרובות יותר ויותר על ידי חברות, ארגונים וממשלות, כך שהם יכולים ליצור פרופילים מדויקים על אנשים. משתמשים או אזרחים כמעט ולא מקבלים הודעה על אילו נתונים אישיים נרשמים, קל וחומר מדוע ואיך. למותר לציין שיש לכך השלכות חמורות על פרטיותן המקוונת. כל מה שהם עושים באינטרנט ניתן לשמור ולהציג בהמשך. יתרה מזאת, אספני נתונים גדולים יכולים להשפיע ולתמרן בקלות על קבלת ההחלטות של אנשים על ידי ניתוח הנתונים שנאספו ושימוש בהם.

נתונים גדולים ופרטיות

סמארטפון עם תמונה של האוזןכפי שבטח תבינו כבר עכשיו, נתונים גדולים מגיעים עם הרבה חסרונות וסיכונים. עם זאת, חברות וארגונים רבים עדיין אוספים נתונים בהיקף עצום, בעיקר בגלל האופן בו זה יכול לעזור להם לצמוח ולהתקדם. איסוף נתונים גדולים יותר קל מאי פעם. יש לכך השלכות עצומות על פרטיותנו. דיברנו בקצרה על סכנות הפרטיות האפשריות של גורמים זדוניים שאוספים נתונים רעים. מכיוון שהפרטיות שלנו קשורה כל כך לאוסף המוני של נתונים אישיים, אנו רוצים להשתמש בסעיף זה כדי לדון בחששות הפרטיות השונים שמגיעים עם נתונים גדולים.

איסוף נתונים בקנה מידה גדול

המון חברות, כולל גוגל, פייסבוק וטוויטר, תלויות מאוד בפרסומות כדי לקיים את עצמן ולהרוויח. כדי להפוך מודעות אלה ליעילות ככל האפשר, חברות אלה מפרסמות פרופילים מפורטות למשתמשים שלהן, במיוחד תוך התחשבות באהבות והאינטרסים שלהן. זו סוג של נתונים גדולים. כמו כן, ממשלות ושירותים חשאיים תלויים גם בנתונים גדולים. הם משתמשים בכמות עצומה זו של מידע כדי לעקוב אחר אנשים שהם חושדים שהם חושדים. כמובן שזה אומר שיש המון נתונים גדולים עבור פושעי סייבר לשים ידיים ואולי אפילו לתפעל ולהתעלל. זה יכול ליצור כל מיני בעיות פרטיות וקשורות זהות. אחד שעולה על הדעת הוא גניבת זהות.

ובכל זאת, האפשרויות שמגיעות עם האוסף במאגרי מידע גדולים בהרבה מזה. בימינו הטכנולוגיה הפכה למתקדמת ו”חכמה “עד שהיא יכולה לשלב מערכי נתונים. ניתן לעשות זאת בצורה כל כך חכמה ומלאכה, עד כי חברות וארגונים גדולים ככל הנראה יודעים עליכם יותר מכם! מי אתה, איפה אתה גר, מה התחביבים שלך, מי החברים שלך: אף אחד ממידע זה לא יהיה פרטי יותר. לא מחשבה מנחמת במיוחד, אתם עשויים לחשוב. למרבה המזל, ישנן כמה דרכים להגן על עצמך מפני הפרת הפרטיות בקנה מידה גדול שיכולה לגרום לנתונים גדולים.

חוקים בנושא פרטיות

עוגיות על המסךחוקים ותקנות פרטיות יכולים להגן עלינו מפני הפרת פרטיות, אך רק במידה מסוימת. כדי להפוך את העניינים למורכבים יותר, לעתים קרובות חוקי הפרטיות שונים מאוד בין מדינות ואזורים שונים. לדוגמה, באירופה חוק לתוקף חוק פרטיות צרכני יחסית המכונה “תקנת הגנת המידע הכללית” (GDPR). חוק זה חל על כל המדינות החברות באיחוד, אם כי הפרטים עשויים להיות שונים בכל מדינה. חברות בינלאומיות רבות החליטו לשמור על כל עסקיהן ל- GDPR. זו הסיבה שגוגל, למשל, מאפשרת כעת למשתמשים לבקש מחיקה של מידע אישי. עם זאת, חוקי הפרטיות בארצות הברית שונים ממדינה למדינה ואינם מגנים על הצרכנים ועל האיחוד האירופי. לרוע המזל, הדבר נכון אפילו לחוק הפרטיות הקשה ביותר בארה”ב, חוק פרטיות הצרכן בקליפורניה.

בקיצור, אין דבר כזה חוק פרטיות “גלובלי” חזק, החול על כל אספני הנתונים הגדולים ומגן על כל המשתמשים. משמעות הדבר היא שפרטיותנו אינה נפגעת רק על ידי אספני נתונים גדולים באופן בלתי חוקי, אלא אפילו בדרכים חוקיות לחלוטין, עד כמה שזה נשמע פרדוקסאלי. למרבה המזל, הפרות פרטיות רחבות היקף שנחשפו על ידי מפוחי משרוקיות כמו אדוארד סנודן וצ’לסי מאנינג, העלו מאוד את המודעות לסיכונים של נתונים גדולים. כמובן שזהו רק צעד ראשון בשיפור חוקי הפרטיות הנוכחיים.

משתמשי אינטרנט רבים אינם מוכנים לחכות לשיפור בחוקי הפרטיות – ובצדק. במקום זאת, הם רוצים לנקוט בפעולה בעצמם על ידי ביצוע כל שביכולתם כדי להגן על פרטיותם. האם אתה רוצה להימנע גם מלהיות חלק מאינספור מערכי נתונים גדולים? יש כמה טיפים וטריקים שיעזרו לך בדרך שלך.

כיצד לשמור על שמירת הנתונים שלך במערכות נתונים גדולים

מערכי נתונים גדולים משפיעים באופן רציני על פרטיותך ואבטחתך. מערכי נתונים אלה עשויים להכיל כל מיני מידע (אישי) שיכולים להיות מנוצלים לרעה על ידי חברות גדולות או אפילו עברייני סייבר. לכן עליכם תמיד לדאוג להשאיר כמה שפחות עקבות מקוונים. העצות הבאות יכולות לעזור לך להשיג זאת:

  • נסה למזער את השימוש במידע האישי שלך בעת יצירת סיסמאות או באופן כללי באינטרנט. למשל: הימנע משימוש בשמך, בכתובת, במספר הטלפון, בתאריך הלידה וכן הלאה.
  • זכרו תמיד את הדברים הבאים: כל מה שתפרסמו באינטרנט, יהיה שם לנצח. זה אולי לא תמיד נכון לחלוטין, אך רמת זהירות זו אכן עוזרת לשמור על פרטיותך. תטפל באופן אוטומטי יותר בנתונים הפרטיים שלך לאחר שתודע לעובדה זו.
  • וודא שחיבור האינטרנט שלך מאובטח ואנונימי, למשל באמצעות דפדפן Tor או VPN למשל.
  • השתמש באחד או במספר חוסמי מודעות בדפדפן שלך.
  • השתמש בתוספי דפדפן או יותר החוסמים עוקבים ועוגיות.
  • יש לנקות את המטמון באופן קבוע ולמחוק את היסטוריית הגלישה ואת קובצי ה- cookie שלך.
  • התנתק מאתרים כאשר אינך משתמש בהם באופן פעיל.

נקיטת צעדים אלה היא התחלה טובה בכל הקשור לשמירה על פרטיותך ואבטחתך באינטרנט. עם זאת, זכור כי נתונים גדולים נאספים בדרכים רבות ושונות – לא רק באינטרנט. בקיצור, בכל מקום שאתה נמצא ובכל מה שאתה עושה, עליך תמיד להיות ערני ולנסות להגן על הנתונים (האישיים) שלך מפני אספני נתונים גדולים.

Kim Martin Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map