Wikipedia fact Checking

האם ויקיפדיה תהיה מדויקת יותר? על “בודק העובדות” החדש של מטא

חברת מטא (הלא היא השם החדש והלא קליט של פייסבוק) מפתחת בימים אלו מנגנון מבוסס בינה מלאכותית, אשר נועד “לבדוק עובדות” בויקיפדיה. על פניו, מדובר במטרה יומרנית במיוחד: בעידן בו אנו חיים, “עובדות” הן לא פעם נושא למחלוקת. אנו חיים בתקופה שבה אי אפשר להסכים על דבר, וגם בויקיפדיה המחלוקות הן לא פעם בלתי ניתנות לגישור. במציאות כזאת שבה אין עובדות, איך בכלל אפשר לעשות “בדיקת עובדות”?

אבל האמת היא שהמודל שמטא מפתחת, הוא לא בדיוק מכשיר לבדיקת עובדות. האמת, המודל עושה משהו הרבה יותר מגניב: בודק את הקשר בין הערות השוליים לבין הטענה הנטענת על בסיסן. למה הכוונה? בויקיפדיה נהוג לגבות את הטענות (ככל האפשר) בהערות שוליים, המפנות למקור כזה או אחר, שהוא הבסיס לטענה העובדתית שנטענה בטקסט. לפי הפרסום, מטא פיתחה מודל שיבדוק עד כמה הציטוט או הטענה העובדתית הנטענת על בסיס אזכור המקור, אכן נשען על אותו מקור.

לפי הפרסום, המודל סורק את המקור המופיע בהערות השוליים, ובודק את הקשר שלהן לטקסט, על ידי “קריאה” של המקור. המודל נשען על הדאטה-בייס של מטא, Sphere, אשר מכיל יותר מ-134 מיליון עמודים, ואלו משמשים בתור מאגר המידע של המודל ללמידת השפה האנגלית. ברמה מסוימת, המודל כאילו מבין את השפה: זה לא שהוא “סתם” מחפש אוטומטית בהערות השוליים את המילים מויקיפדיה, אלא הוא לומד משמעויות מתוך הקשרים, על בסיס מודל מתמטי מתוחכם של הבנת שפה (Natural Language Understanding). בנוסף לכך, המודל החדש מדרג מקורות בהתאם לרלוונטיות ההיררכית שלהם. למשל, מאמר אקדמי ידורג גבוה יותר מכתבה באתר חדשות, והיא תדורג גבוה יותר מפוסט בבלוג אינטרנטי.

מודל אנטי-ויקיפדי

בשנת 1993 פיתחה מיקרוסופט אנציקלופדיה דיגיטלית בשם Encarta. תחילה היא הופצה על גבי תקליטור, ובהמשך בגירסת אונליין מתעדכנת בתשלום. ב-2009 מיקרוסופט החליטה לסיים את הפרויקט, כאשר הדעת נותנת שהיה לכך קשר הדוק להצלחתה של ויקיפדיה

אולם למה בכלל הזכרתי את Encarta? משום שאנו למדים מכך על סיכויי ההצלחה של פרויקטים אנציקלופדיים בעידן המידע. נכון, ויקיפדיה אינה מושלמת: אי אפשר לכתוב עבודות אקדמיות או לכתוב טקסטים רציניים, ולהשתמש בויקיפדיה כמקור, היות והיא לחלוטין לא מדויקת מספיק, וסובלת מהטיות כאלו ואחרות. אולם אני סבור שאין שום מודל שיוכל להפוך את ויקיפדיה למושלמת: לטוב ולרע, ויקיפדיה היא פרויקט הנשען על חוכמת ההמונים. היא מבטאת את הצייטגייסט של התפיסה האנושית והחברתית ביחס למושגים ולרעיונות הכלולים בה. ניסיון לתקן את הערות השוליים על ידי מודל מבוסס בינה מלאכותית, מעקר את האנושיות מתוכה, והופך אותה למשהו אחר. 

בנוסף לכך, מטא היא לא חברה פילנתרופית; רחוק מכך. אם הפרויקט שלה יצליח, מי יודע כיצד תתרגם מטא את ההצלחה הזאת לכדי רווחים: האם שוב קצירת מידע? האם על ידי השתלטות עוינת על ויקיפדיה? האם על ידי נעילת ויקיפדיה לגירסת פרימיום? כל הצלחה של פרויקט כזה יהיה ככל הנראה הפסד של האנושות בטווח הארוך.

אני עצמי

מה אני יכול לעשות עבורכם? זו השאלה שממנה ראוי להתחיל בעיני. ובכן, אני יכול לייצר עבור האתר שלכם תכנים שיהיו יפים, מקצועיים ואפילו מעניינים. אני יכול אף להקים את האתר שלכם מאפס, ולשווק לכם ולעסק שלכם תדמית מקצועית ומושכת, שתציג אתכם באור הכי יפה שאפשר. אני אף חוטא בכתיבה פובלציסטית לא מעט, ואני יכול לכתוב עבורכם מאמרי דעה משלהבים, נאומים ואפילו משנה פוליטית סדורה. אתם מוזמנים לעיין באתר שלי ולראות דוגמאות כתיבה רבות, לכל מיני סוגים של כתיבה ויצירה. לפרטים נוספים, לחצו על ״צור קשר״ למעלה בתפריט.