עודכן לפני חודש
כל מסד נתוני GeoIP צריך לענות על אותה שאלה מיליוני פעמים ביום: היכן נמצאת כתובת IP זו?
רוב הזמן, הוא נותן תשובה סבירה. אבל לפעמים הוא פשוט לא יודע. כתובת ה-IP עשויה להיות מוקצית באופן דינמי, מנותבת דרך פרוקסי, או חדשה מכדי שמישהו ימפה אותה. למסד הנתונים אין מושג היכן נמצא המכשיר בפועל.
הבעיה: "אני לא יודע" אינה קואורדינטה חוקית. מסד הנתונים חייב להחזיר משהו. ולכן הוא מחזיר ערך ברירת מחדל — קואורדינטות שמשמעותן "איפשהו בארצות הברית."
במשך יותר מעשור, ברירת המחדל הזו הצביעה על בית חווה בכפר בקנזס. האנשים שגרו שם שילמו את המחיר עבור כל כתובת IP בלתי ניתנת למיפוי באמריקה.
הקואורדינטות
בשנת 2002, MaxMind הזדקק למיקום ברירת מחדל עבור כתובות IP שיכול היה לפתור רק לרמת המדינה. הבחירה ההגיונית הייתה המרכז הגיאוגרפי של ארצות הברית הצמודה, שנקבע על ידי ה-U.S. Coast and Geodetic Survey ב-1918 ב-39°50′N 98°35′W, כשני מיילים צפון-מערבית ללבנון, קנזס1. MaxMind עיגל למשהו נקי יותר: 38.0000, -97.00002.
הזוג מספרים הזה נחת בחצר הקדמית של בית חווה דו-קומתי ליד פוטווין, קנזס. הבית היה בידי משפחת וגלמן מאז 19022.
מנקודת המבט של האינטרנט, הוא היה גם ביתן של יותר מ-600 מיליון כתובות IP2.
מה קורה כשמסד נתונים מצביע על הבית שלך
המבקרים הראשונים הגיעו תוך שבוע ממועד המעבר של בני משפחת ארנולד, ב-1 במאי 2011. שני שוטרים הגיעו לחפש משאית גנובה3. ואז זה המשיך לקרות, "אינספור פעמים" במשך חמש שנים3:
- סוכני FBI שחקרו הונאות מחשב
- מרשלים פדרלים שהגישו צווים
- גובי מסים מה-IRS שחיפשו חייבי מס
- אמבולנסים שחיפשו ותיקים אובדניים
- שוטרים שחיפשו ילדים שברחו מהבית
- זרים כועסים שעקבו אחרי מכשירים גנובים או חשבונות שנפרצו עד לכתובת הזו
זרים נמצאו בתוך האסם2. מישהו השאיר אסלה שבורה בשטח כאיום2. ברשת, אנשים שעשו דין לעצמם פרסמו את שמות המשפחה ב-YouTube, Reddit ו-Facebook, והאשימו אותם בגניבת זהויות והונאות2.
שריף מחוז באטלר הציב שלט אזהרה בכניסה לשביל החווה2. לשוטריו היו הוראות קבועות: האנשים שגרים כאן אינם עבריינים.
הפער בין "מדינה" לבין "בית"
מייסד-השותף של MaxMind, תומס מאת'ר, אמר מאוחר יותר שמעולם לא עלה בדעת החברה שאנשים ישתמשו במסד הנתונים כדי לעקוב אחרי מישהו עד לרמת משק הבית2.
MaxMind שיווקה את מסד הנתונים שלה כמדויק לרמת עיר או מיקוד. הקואורדינטות היו נוחות תכנותית לצורך הצגת נקודה על מפה, ומעולם לא יועדו לייצג כתובת רחוב.
אבל רשויות אכיפת החוק הכניסו כתובות IP לכלי בדיקה, קיבלו קואורדינטות, הזינו אותן ל-Google Maps, ונסעו לאיזה מבנה שהופיע שם. קורבנות פשעי סייבר חיפשו את כתובת ה-IP שפרצה לחשבונם, מצאו קואורדינטות, והגיעו בעצמם.
מסד הנתונים אמר "איפשהו באמריקה." אנשים שמעו "ממש כאן."
כל קואורדינטת GeoIP נושאת טענת דיוק מרומזת שהנתונים הבסיסיים אינם תומכים בה. תוצאה המדויקת לרדיוס של 50 קילומטר נראית זהה על מפה לאחת שמדויקת ל-10 מטרים. שתיהן נקודה. אף אחת מהן לא מגיעה עם אזהרה.
כיצד זה התגלה
שנים רבות, לבני משפחת ארנולד לא היה מושג מדוע ביתם ממשיך למשוך רשויות אכיפת חוק וזרים כועסים. לא היה להם כל קשר לתשתית הטכנית של האינטרנט. הם גרו בחווה.
עיתונאית בשם קשמיר היל היא שחיברה את הנקודות. המאמר שלה מ-2016 ב-Fusion זיהה את קואורדינטות ברירת המחדל של MaxMind כגורם השורש2. המאמר חשף שאותה בעיה פגעה גם באחרים. לטוני פאב באשבורן, וירג'יניה, מופו יותר מ-17 מיליון כתובות IP לביתו, וכמעט שברו את דלתו שוטרים שחיפשו מחשב נייד ממשלתי גנוב2.
רק לאחר פרסום המאמר הגיבה MaxMind.
הפתרון
MaxMind העבירה את ברירת המחדל האמריקאית שלה למרכז אגם Cheney Reservoir, אגם מערבית לוויצ'יטה4. אם "אני לא יודע" חייב להצביע על מקום כלשהו, עדיף שיצביע על מקום שאף אחד לא גר בו.
בני משפחת ארנולד הגישו תביעה נגד MaxMind באוגוסט 2016, וביקשו פיצויים העולים על 75,000 דולר3. התיק הסתיים בפשרה בספטמבר 20174.
ג'ויס טיילור, הבעלים בת ה-82 שמשפחתה עיבדה את האדמה במשך יותר ממאה שנה, לכאורה הציבה שלט בחצרה:
"לכו לקפוץ לאגם."
מה זה מלמד אותנו
ברירות מחדל הן החלטות. כשMaxMind בחרה 38.0000, -97.0000, איש לא חשב על זה כהחלטה שתשפיע על אדם אמיתי. זה היה ערך null עם לבוש גיאוגרפי. אבל כל ברירת מחדל נוחתת איפשהו, ו"איפשהו" הוא תמיד המציאות של מישהו.
מספרים מדויקים אינם מידע מדויק. שש ספרות אחרי הנקודה בקו הרוחב ובקו האורך מרמזות על מיקום ספציפי בדיוק של סנטימטרים. אבל כשהנתונים הבסיסיים אומרים "ארצות הברית," שש הספרות הללו הן בדיה. הקואורדינטה מדויקת. הידע שמאחוריה אינו.
מערכות אינן מכילות את השימוש שנעשה בהן. MaxMind בנתה מסד נתונים לגיאולוקציה ברמת עיר. אנשים השתמשו בו לחקירות ברמת משק הבית. למסד הנתונים לא היה מנגנון לומר "תוצאה זו היא ניחוש, לא תשובה." ולכן כל ניחוש טופל כתשובה.
זהו המחיר האנושי של ההפשטה המתוארת בכיצד GeoIP עובד. GeoIP היא קירוב שימושי, אבל קירובים הופכים מסוכנים ברגע שמישהו מבלבל אותם עם האמת.
בני משפחת ארנולד לא היו צריכים להבין גיאולוקציה של IP. גיאולוקציית IP הייתה צריכה להבין את מגבלותיה שלה. היא לא הבינה. ובמשך חמש שנים, בכל פעם שהמערכת אמרה "אני לא יודע," היא הצביעה על דלתם הקדמית.
שאלות נפוצות על חוות ה-GeoIP בקנזס
מדוע בחר MaxMind בקואורדינטות ליד מרכז ארצות הברית?
כשמסד נתוני GeoIP יכול לקבוע רק שכתובת IP ממוקמת בארצות הברית אבל אינו יכול לצמצם מעבר לכך, הוא זקוק לקואורדינטת ברירת מחדל להחזרה. MaxMind בחר נקודה ליד המרכז הגיאוגרפי של המדינה בתור תחליף הגיוני למשמעות "אני לא יודע". הבעיה הייתה עיגול המרכז הממשי (39°50′N 98°35′W, ליד לבנון, קנזס) לקואורדינטות הנקיות יותר 38.0000, -97.0000, שנפלו בדיוק על רכוש של מישהו.
האם הבעיה נפתרה לחלוטין?
MaxMind העבירה את ברירת המחדל האמריקאית שלה למרכז אגם Cheney Reservoir, אגם בקנזס, כך שהקואורדינטות אינן מצביעות עוד על ביתו של אף אחד. עם זאת, הבעיה הרחבה יותר נמשכת: תוצאות GeoIP בכל רמת דיוק עלולות להתפרש בטעות כמיקומים מדויקים. לספקי GeoIP אחרים יש ברירות המחדל שלהם, וכל מערכת מבוססת קואורדינטות מתמודדת עם אותה בעיה בסיסית. נקודה על מפה תמיד נראית מדויקת יותר מהנתונים שמאחוריה.
האם ניתן להשתמש בנתוני GeoIP כדי לאתר אדם ספציפי או משק בית?
לא. מסדי נתוני GeoIP מיועדים לאמוד מיקום ברמת העיר או האזור, לא לזהות כתובות ספציפיות. אפילו במיטבם, מסדי נתוני GeoIP מסחריים בדרך כלל מאתרים שכונה או מיקוד, לא בניין. שימוש בקואורדינטות GeoIP כדי לבקר בכתובת פיזית הוא שימוש לרעה בטכנולוגיה — אבל הטכנולוגיה עצמה לא מונעת זאת.
האם מיקומים אחרים נפגעו מקואורדינטות ברירת מחדל של GeoIP?
כן. בית באשבורן, וירג'יניה, היו לו יותר מ-17 מיליון כתובות IP מצביעות עליו2. זוג באטלנטה חווה בעיות דומות מאפליקציות מעקב אחר מכשירים שהשתמשו בנתוני GeoIP2. חוות קנזס הייתה המקרה הקיצוני ביותר מכיוון ששימשה כברירת מחדל לכלל ארצות הברית.
מקורות
האם דף זה היה מועיל?