שלח לחבר
דף הבית > חדשות משפטיות > הכירו את "התולעת": המיזם החתרני שפועל לשקיפות במערכת המשפט

חדשות

הכירו את "התולעת": המיזם החתרני שפועל לשקיפות במערכת המשפט, צילום: getty images Israel
הכירו את "התולעת": המיזם החתרני שפועל לשקיפות במערכת המשפט
22/02/2018, עו"ד לילך דניאל

אנדי וורמס, מתכנת מחשבים חיפאי, פיתח לפני ארבע שנים תוכנה ייחודית ש"זוחלת" באתר נט המשפט ומעתיקה נתונים גולמיים שפתוחים לעיון הציבור. את הממצאים הוא מפרסם בין היתר באתר ובדף הפייסבוק "תולעת המשפט" שבניהולו: "יש הרבה מידע משפטי שקבור עמוק בכל מיני מערכות סגורות וצריך להוציא אותו החוצה"

מדי שנה מפרסמת הנהלת בתי המשפט דוח שנתי המסכם את פעילותה ומציג נתונים סטטיסטיים על כמות התיקים, תיקים שנפתחו ותיקים שנסגרו, ממוצע אורך חיי תיק ועוד. לפי אתר הרשות השופטת, הדוח מתפרסם כחלק מ"עיקרון השקיפות ושיפור השירות לציבור המתדיינים בבתי המשפט", אך יש שיגידו שמדובר בנתונים חלקיים, לא ממצים ומאוחרים, בין היתר בהתחשב בכך שהדוח השנתי לשנת 2016 פורסם רק בסוף שנת 2017.

אנדי וורמס, מתכנת מחשבים מחיפה, שואף להגביר את השקיפות במערכת המשפט ולכן הקים לפני כארבע שנים את פרויקט "תולעת המשפט" הפועל על התפר שבין אקטיביזם לחופש מידע. באמצעות תוכנה שפיתח ה"זוחלת" באתר נט המשפט ומדמה את הפעילות של גולש אנושי, מצליח וורמס לשלוף נתונים גולמיים שיכולים להוות תשתית למחקרים ותחקירים מעניינים. את הנתונים הוא מוסר לדבריו לאנשי אקדמיה, עיתונאים ופעילים חברתיים ומפרסם גם באתר ובדף הפייסבוק "תולעת המשפט" שהוא מנהל, המונה כיום כ-100 חברים. "אני איש טכנולוגיה עם דגדוג קל עד בינוני לסוגיות חברתיות", אומר וורמס בראיון ל"תקדין". "מאז ומתמיד עניינו אותי פלטפורמות פתוחות שמקדמות גישה שוויונית יותר לטכנולוגיות מידע ולידע כמו לינוקס, ויקיפדיה ובכלל תנועת הקוד הפתוח".

לקבלת עדכוני חדשות, פסיקה וחקיקה ישירות למייל, לחץ כאן

הפעולה שוורמס מבצע נקראת בשפה הטכנולוגית "גירוד" (crawling) והנתונים שהוא שולף הם "מטא-דאטה", כלומר לא פסקי הדין וההחלטות עצמם אלא מידע על התיקים – שם השופט, באיזה בית משפט התנהל התיק, הסכום שנתבע, תוצאת ההליך, תאריך מתן פסק הדין וכד', המאפשרים לבצע ניתוח סטטיסטי באמצעות אקסל ודומיו. "מדובר למעשה בתוכנה שפועלת כמו גולש אנושי", הוא אומר. "הרובוט, אותו אני מכנה בחיבה "התולעת", פשוט נכנס לאתר נט המשפט, מבקש את תיק מספר 1, אחר כך את תיק מספר 2, וכן הלאה, ומעתיק את כל הנתונים שפתוחים לעיון הציבור בצורה יותר מהירה וגם יותר מדויקת מגולש אנושי. בנוסף, מן הסתם הרובוט יכול לעבוד מסביב לשעון, גם בלילות ובסופי שבוע. אם תיק חסוי אז הרובוט, כמו הגולש האנושי, חוטף הודעת שגיאה ולא יכול לגשת לנתונים שבתיק, ואז מדלגים עליו. בצורה כזו לא מגרדים נתונים שבית המשפט החליט שיישארו חסויים".

מה המטרה של הפרויקט? איזה מסר אתה מנסה להעביר?

"לפני הרבה שנים עשיתי בעצמי את התרגיל הבסיסי באזרחות של ללכת ולשבת בבית המשפט כדי לשמוע דיונים ולראות את גלגלי הצדק מסתובבים. התאכזבתי ללמוד שלא רק שהדיון לא מוסרט אלא שהדבר אסור על פי חוק, וגם הפרוטוקולים לא מתפרסמים בדרך כלל. צריך לזכור שמדובר ברשות השופטת שאמורה להוביל בשקיפות ובפתיחות, וכל זה כשאנחנו נמצאים כיום בעידן הדיגיטלי ואוהבים להתקשט בכינוי 'אומת הסטארט אפ'. החלטתי שיש הרבה מידע משפטי שקבור עמוק בכל מיני מערכות סגורות ולא נגישות וצריך להוציא את זה החוצה.

מטרת הפרויקט היא להנגיש את המידע המשפטי הרב שנמצא במערכת המשפט לעיתונאים, אנשי אקדמיה, פעילים חברתיים, והציבור בכלל, כאשר מדובר במידע פומבי וציבורי על פי חוק. יום אחד מערכת המשפט תהיה הרבה יותר פתוחה ושקופה ותשים באינטרנט נתונים גולמיים ובזמן אמת על כל הנעשה בבתי המשפט. עד שזה יקרה אני עושה את זה כתחביב וכתרומה לחברה. מגיע לחוקרים, סטודנטים, ולציבור הרחב להכיר יותר מקרוב את הנעשה, להיחשף לשליחותם של השופטים והעוסקים במלאכה, ולהתרשם באופן בלתי אמצעי ולא רק דרך דוברים ודו"חות תקופתיים למיניהם".

האם אתה נתקל בקשיים במהלך הפעילות?

"הפעולה נשמעת פשוטה מאוד, והעיקרון אכן קל, אלא שבמערכת המשפט יש מלא מקרי קצה שחייבים התייחסות. לדוגמה, לא ניתן לעיין בתיק 4913/2010 באתר האינטרנט של בית המשפט העליון. למה? לא ידוע, פשוט מדובר בבאג באתר שלהם. עוד דוגמה: ב-3 בפברואר 2010 ניתנה בתיק 40148-01-10 החלטה על בקשה לשינוי מועד דיון, לכאורה נושא טריוויאלי, שכוללת 306 עמודים(!). למה? סתם השתרבבו בנט המשפט מסמכים לא קשורים, אבל התולעת חייבת להתמודד עם המסמך הארוך הזה. לאו דווקא כי המקרה הזה הוא נורא מעניין, אלא כי הרובוט חייב להיות מסוגל לסרוק באופן אוטומטי מספר גדול של תיקים ואסור להיתקע על כל מיני מקרים חריגים. התולעת כבר פצועה וחבולה מכל הבאגים האלה של אתרי הממשלה, וצריך כל הזמן לתקן את זה ולדאוג שהיא תוכל להמשיך בעבודה. יש לזה הרבה פתרונות. לפעמים מנסים מספר פעמים עד שזה מצליח, או מוותרים ומדלגים לתיק הבא. העיקר לא להיתקע".

* "הממשלה זזה לאט אבל החברה האזרחית יותר זריזה וחדשנית" *

אך מערכת המשפט לא כל כך אוהבת שמתעסקים לה עם ה"נט". כזכור, בשנת 2012 נעצר הבלוגר משה הלוי, המכנה עצמו "הלמו", בחשד שפרץ לנט המשפט וחשף חומרים סודיים ורגישים, אלא שהתיק נגדו נסגר בסופו של יום מחוסר ראיות. גם בעולם, אחד החלוצים הידועים של גירוד חומר משפטי היה המקרה של אהרון שוורץ האמריקאי, מתכנת, יזם ואקטיביסט שהוריד מיליוני פסקי דין ממערכת ה PACER (המקבילה האמריקאית לנט המשפט) תוך שהוא עוקף את מערכת התשלומים של האתר שבאותה עת גבתה 8 סנט לעמוד. גם נגד שוורץ לא הוגש בסופו של יום כתב אישום בפרשה.

לעמדתו של וורמס, הפעילות של "תולעת המשפט" היא לגיטימית לחלוטין: "אני לא עורך דין, אבל פעולת הגירוד לכשעצמה אינה בלתי חוקית", הוא אומר. "גוגל עושה את זה בשביל להזין נתונים למנוע החיפוש שלה, וזה גם פעולה מאוד מקובלת באתרי האינטרנט למציאת דילים בתחום התיירות, שם מגרדים את אתרי האינטרנט של חברות תעופה ובתי מלון בשביל להשוות מחירים. לגירוד יש  היבטים של זכויות יוצרים כי הוא טומן בחובו מרכיב כזה או אחר של העתקת נתונים, אבל במקרה כזה מדובר במידע משפטי וציבורי שבנוסף חל עליו חוק חופש המידע".

עוד הוא מוסיף כי "יש גם פן של ביצועים, כי גירוד אינטנסיבי מדי עלול להאט או להשבית כליל את האתר שסורקים אותו. את הדברים האלה יכול להסדיר אתר באמצעות תנאי השימוש או קובץ robots.txt שפועל כמעין 'שוטר תנועה' לרובוטים מגרדים, ואפשר סתם לבקש יפה. למשל, באוקטובר 2017, אתר PACER הוציא הודעה ובה ביקש ממפעילי רובוטים להגביל את עצמם לשעות הלילה בלבד. בסוף זה מסתכם בשאלה של סבירות וזהות אינטרסים. אם אני מגרד את פייסבוק כדי להקים רשת חברתית מתחרה ברור שפייסבוק תפעל לעצור את זה, גם משפטית. אם אני סורק אתר מסחרי כדי להביא גולשים ממנוע חיפוש או אתר השוואת מחירים, בעלי האתר ישמחו ואף ישתפו פעולה. במקרה של תולעת המשפט, הפעולה היא לטובת שקיפות והנגשת מידע שהוא פומבי גם ככה ומפורסם ממילא על ידי משרד המשפטים".

מה אתה עושה עם הנתונים?

"אני מעביר אותם לאנשי אקדמיה, עיתונאים, פעילים חברתיים. לפעמים מיוזמתי, לפעמים אנשים מבקשים ממני ("אתה יכול להביא לי אקסל עם כל הערעורים הפליליים בין השנים 2010 עד 2015?"). כרגע מספר אנשים עובדים על מחקרים ואני מקווה מאוד שיהיו פרסומים בקרוב. אבל הכי כיף, כשיש קצת זמן, לפתוח את הנתונים בעצמי באקסל ולמצוא כל מיני מקרי קצה, כמו תיק שהוגשו בו הכי הרבה בקשות או התקיימו הכי הרבה דיונים, או לאתר את התביעה עם הסכום הכספי הכי גבוה".

יש לך דוגמאות לדברים מעניינים שגילית?

"לאחרונה פרסמנו בפייסבוק של התולעת על פערים גדולים בין השופטים באחוז הנאשמים שהם שולחים למעצר עד תום ההליכים. מצאנו גם מי הגוף בארץ שהכי הרבה חוטף תביעות קטנות. בנוסף, סייענו לתנועה לזכויות דיגיטליות לעקוב אחרי למעלה מ-200 תביעות ספאם שהוגשו ביוזמתה נגד משרד הפנים לאחר שזה שלח מסרון לאזרחים. נתון מעניין נוסף הוא לגבי תביעות ייצוגיות - בדקנו מתוך יותר משבעת אלפים תובענות ייצוגיות שהוגשו בין השנים 2010 ו-2017 ומצאנו מהן התביעות הגדולות ביותר שהוגשו – תביעה בסך 27 מיליארד שקל נגד מי אביבים ועיריית תל אביב בגלל מחלוקת על חישוב חובות בחשבון המים, תביעה בסך 1.7 מיליארד שקל נגד עריית תל אביב בגלל מחלוקת על גביית דמי כניסה לחוף הים ותביעה בסך 900 מיליון שקל נגד פייסבוק בגין שליחת מסרוני ספאם. הנתונים הגולמיים בהחלט יפורסמו כך שמי שמתמצא באקסל יוכל לדעת. יש אינסוף דברים שאפשר לבדוק, להצליב עם מאגרי נתונים נוספים וכו'".

האם קיבלת תגובות על כך? איזה ומאלו גורמים?

"אנשים שמבינים בתחום, שבאים מרקע משפטי, טכנולוגי, או מרקע אחר כגון פעילות חברתית, שקיפות, חופש המידע - מאוד מתלהבים ומפרגנים. השמועה עוברת מפה לאוזן ויש הרבה ביקושים לאוספי נתונים שונים שאנשים רוצים. ברוב סופי השבוע והלילות לתולעת יש סידור עבודה. פעם עיתונאי ביקש לגרד את אוסף המינויים המקצועיים של בתי המשפט. הוא טען באוזניי שיש "קומבינות" ושאותם אנשי מקצוע (מומחים רפואיים, מפרקים, כונסי נכסים) זוכים פעם אחר פעם במינויים שמניבים הכנסות נאות מאותם שופטים. בסוף נמצא שהמינויים מתחלקים בצורה פחות או יותר שווה בין מספר רב של אנשי מקצוע, ולמרבה השמחה לא היה שום "אקדח מעשן". מצד שני פספסנו את ההזדמנות לחשיפה תקשורתית גדולה יותר, אבל ככה זה עובד: אם משהו תקין אז הוא לא יזכה לכותרת. בעיניי מה שחשוב שפעילים טכנולוגיים מבצרים את חומת ההגנה סביב הדמוקרטיה ומוסדות השלטון".

האם היית רוצה לראות פרויקטים דומים במשרדי ממשלה נוספים?

"הלוואי! רק במשרד המשפטים עצמו האנדרלמוסיה חוגגת ויש אתרי אינטרנט ומערכות מידע שונות לכל דבר. יש את נט המשפט למרבית הערכאות, ולבית המשפט העליון יש אתר אינטרנט נפרד. בתי משפט לעניינים מקומיים רק חלקם נמצאים בנט המשפט. יש ערכאות אזוטריות יותר כמו מפקחים על בתים משותפים או בתי הדין למשמורת לעובדים זרים שרק מפרסמים פסקי דין נבחרים, ובבתי הדין הדתיים רק אלוהים יודע מה קורה. במצב האידיאלי רשויות המדינה היו בעצמן מעמידות לרשות האזרחים את כל המידע שברשותן, באופן גולמי ובזמן אמת. תחת זאת הן מקימות כל מיני מערכים של ביקורת, דוברות וכיוב'. להנהלת בתי המשפט יש אפילו מחלקת מחקר, אבל כל עוד היא לא מפרסמת באופן גולמי ובזמן אמת את כל המידע שברשות המערכת מדובר במחלקת תעמולה או יחסי ציבור במקרה הטוב.

למזלנו הממשלה זזה לאט אבל החברה האזרחית יותר זריזה וחדשנית. יש מתנדבים שעושים פעילות ברוח זו בסדנא לידע ציבורי, למשל הפרויקטים של "כנסת פתוחה" על הכנסת ופעילותה ו"אניוואי" שחושף שכבת מידע גיאוגרפית על תאונות דרכים. אני צופה שעד 2028 יהיה בסיס נתונים ממשלתי פתוח שמתעדכן בזמן אמת על כל התיקים בדלתיים פתוחות בארץ, ושכל הדיונים, בכל הערכאות, ישודרו בלייב סטרימינג באינטרנט, כברירת מחדל וכל מה שנאמר בהם יעבור תמלול אוטומטי ויהיה זמין לחיפוש וצפייה באינטרנט. היום אסור להסריט דיון ללא אישור בית משפט, אבל במוקדם או במאוחר יבינו ראשי המערכת שזאת המשמעות של "פומביות הדיון" בעידן הנוכחי.

הרשמה לניוזלטר
באפשרותכם להירשם לניוזלטר תקדין ולהתעדכן באופן יומי בחדשות המשפטיות החמות ביותר, בתקצירי פסקי הדין החשובים ביותר שניתנו לאחרונה, בעידכוני החקיקה ובעוד מידע חשוב. כל שעליכם לעשות הוא להקליד את כתובת הדוא"ל שלכם ותקבלו את הניוזלטר לתיבת הדואר שלכם.
הרשם עכשיו
תקדין
/HashavimCmsFiles/images/banners/banner-commit2022.jpg
17 | S:68
קומיט וכל טופס במתנה