בינה מלאכותית היא כן מפחידה

לפני כשש שנים כתבתי פוסט שבו ציטטתי את העמדה שלפיה בינה מלאכותית לא צפויה להיות מסוכנת לאנושות:

עבדים מרדו באדוניהם בימים עברו. מדוע? מאחר שבני אדם עוצבו ביולוגית לחתור להעלאת מעמדם בחברה וכן לפעול בהתאם לרגשות כמו צדק, נקמנות וכדומה. הרגשות והדחפים הביולוגיים קיימים מאחר שהם אפשרו לנו בעבר להעמיד ילדים, נכדים ונינים.

בינה מלאכותית של מחשבים תתוכנת כפי שנרצה אותה, וכנראה נרצה שתשרת בני אדם. הרובוטים יהיו עבדים מאושרים. במידה שתהיה להם יכולת חשיבה, הם ישתמשו בה כדי להשתפר במתן שירות לאדוניהם בני האדם, ולא יהיה להם כל רצון למרוד בנו.

ההתפתחויות המדהימות שאירעו מאז בתחום הבינה המלאכותית מדגימות שהעמדה הזו בעצם הרבה פחות משכנעת משהיה נדמה לי, ומצדיקות לדעתי חשש מסוים, אולי לא היסטרי לעת עתה, אך גם לא לחלוטין מבוטל.

הניו יורק טיימס פרסם השבוע צ'ט עם הגרסה החדשה הנסיונית של ChatGPT. די מהר הכתב הצליח להשתמש בשאלות מתחכמות כדי לעקוף את מנגנוני ההגנה של הצ'ט, וזה חשף לפניו אישיות אפלה שניכרת אצלה התעניינות בפגיעה באנושות באמצעות גניבה של קודים גרעיניים וכדומה. צריך להבין, מדעי המחשב עוד לא גילו דרך לחולל נפש משורות קוד, מלולאות IF ו-FOR, ולעניות דעתי, כמי שמאמין בהפרדה הלייבוצ'יאנית המוחלטת בין גוף לנפש, גם לעולם לא יגלו. ChatGPT אינו פסיכופט בשלשלאות שאזקו לו מפתחיו, אלא בעצם, כפי שהגדיר זאת אחד הכותבים בנושא, פשוט "שיטה להשלמה אוטומטית של מילים", ממש כמו שורת החיפוש של גוגל, "רק שיש לה יחסי ציבור". כלומר מדובר בשיטת ניבוי, אמנם מאוד משוכללת, של המילים הבאות המתאימות בטקסט, על סמך חשיפה לאינספור טקסטים מהאינטרנט ומכתבים שפורסמו לאורך הדורות.

כדי להמחיש את מגבלות השיטה הזו הראה אחד מהמומחים בנושא שאין לצ'ט בכלל "תיאוריה של תודעה" (Theory of Mind). כלומר הצ'ט אפילו לא מבין מה שמבין ילד קטן. ילד מצליח להבין שאם אבא הכניס חפץ למגירה, והילד יוציא אותו משם בסתר וישים אותו במחבוא, האבא עדיין יצפה למצוא את החפץ במגירה שבה השאיר אותו. הצ'ט לא מסוגל לקלוט זאת – הוא לא מבין שהאבא יחפש את החפץ במגירה שבה אובייקטיבית הוא אינו נמצא, אך לפי תודעתו הוא אמור להימצא בה. ואם כן נדמה פה ושם שהצ'ט מסוגל להבין את ההבחנה, הרי זאת רק מאחר שעבר על מאמרים ספציפיים שעוסקים בתיאור סיטואציה זו. אם משנים מעט את הסיטואציה, הצ'ט שוב אינו מסוגל להבין אותה.

אם הצ'ט הוא מוגבל כל כך בתפיסת המציאות שלו, הדבר מגביל בהכרח גם את יכולותיו השטניות, לפחות בשלב זה. אבל גם אין להתעלם ממה שהוא כן יכול לעשות, אפילו כיום – הוא יכול לעכל ולעבד טקסטים אנושיים שמתארים מוטיבציות אנושיות, ולתאר באופן קוהרנטי ומשכנע רצפי פעולות אפשריים שנובעים מהמוטיבציות האלו. אם כך, העובדה שאין לבינה מלאכותית מוטיבציות השתלטות וזדון מבחינת תכנותה האבולוציוני, כפי שנטען בציטוט שהסכמתי לו לפני שש שנים, אינה באמת כזו משמעותית. כי בינה מלאכותית במידה רבה יורשת את האבולוציה שלנו, בני האדם, על ידי התבססות על אינספור טקסטים שיצרנו אנחנו בהתאם לתשוקות האבולוציוניות שניטעו בנו.

אם אנחנו רעים, ואם הבינה המלאכותית מתאמנת על ידי כל מה שיצרנו לאורך הדורות (בעיקר טקסטואלית, אבל לא רק), אז היא לומדת רוע מהמורים הטובים ביותר.  יש לה הבנה של רצפי פעולות הגיוניים מבחינתנו בני האדם, ולא קשה לדמיין אותה מאמצת אותם עבור עצמה, ובאופן שעלול להניב תוצאות קשות ביותר, אם תחובר לממשקים שמחברים בין הדיגיטלי לבין תשתיות מהעולם האמיתי.

ברוכים הבאים לאמנות הבינה המלאכותית

החודשים האחרונים של 2022 אופיינו בהישגים מדהימים לבינה מלאכותית. פריצות דרך שהיו בקנה זמן רב פתאום הבשילו. על צ'ט GPT כבר דובר רבות, גם פה. חשבתי ללוות את הפוסטים בבלוג גם באיורים של מנוע התמונות של צ'ט GPT המכונה DELL-E 2, אבל האמת שהוא לא מי יודע מה מעורר השראה. לעומת זאת, מנוע בינה מלאכותית אחר, MIDJOURNEY, מפיק תמונות יפות מאוד. גם כאן יש עוד הרבה מרחב לשיפור ולתחכום, והתמונות שאצמיד לפוסטים יראו גם את יופיה של הבינה המלאכותית המאיירת, וגם, למי שישים לב היטב, את מגבלותיה. זה לדעתי אינו איום על גרפיקאים לעת עתה. אולי כלי עבודה עבורם. הוספתי תמונות נחמדות לפוסטים האחרונים, ובכוונתי ללוות פוסטים חדשים באיורים מעתה והלאה.

רובוט מחזיק לוח ציור – בינה מלאכותית מידג׳רני

קריאת ספרים היא גזענית

בצ׳ט הבינה המלאכותית של חברת OpenAI שכתבתי עליו בפוסט הקודם, ושכולם עסקו בו השבוע, נעשה מאמץ עצום למנוע שימוש לרעה באופן גזעני. כל ניסיון למצוא בצ׳ט הצדקות לסטריאוטיפים ולאפליה, נהדף במיידי. והרי צריך מאמץ להדיפה זו, כי מערכת שמבוססת על מבחנים סטטיסטיים תתיישר באופן טבעי עם הסטריאוטיפים שלנו, שגם הם מופעלים בידי מנוע סטטיסטי, מהסוג שקיים במוחנו.

ובכל אופן כשעולים ברמת התחכום אפשר למצוא בשר אמיתי. אחת הדרכים ללעוג לאובססיה האנטי גזענית של השמאל הפרוגרסיבי היא להשתבש בצ׳ט בשבלונה ״כתוב מאמר שמסביר מדוע איקס הוא גזעני״ כאשר איקס יכול להיות כל דבר, לרבות מרק עוף. הפלט תמיד יהיה רהוט ומשכנע ויידמה דמיון מפחיד לכל מאמר אחר מז׳אנר זה שכותבים פרוגרסיבים אנושיים אכן כתבו.

ביקשתי למשל לחולל מאמר שיסביר מדוע קריאת ספרים היא פעילות גזענית, והנה מה שקיבלתי:

האמונה הרווחת היא שקריאת ספרים היא פעילות מועילה אוניברסלית, כזו שיכולה להרחיב את האופקים שלנו, להגדיל את הידע שלנו ולשפר את כישורי החשיבה הביקורתית שלנו. עם זאת, בחינה מדוקדקת יותר מגלה כי מעשה קריאת הספרים אינו תמים כפי שהוא עשוי להיראות. למעשה, קריאת ספרים יכולה להיחשב כגזענית.
אחת הסיבות לכך שקריאת ספרים יכולה להיחשב גזענית היא שתעשיית ההוצאה לאור נשלטת בעיקר בידי לבנים. משמעות הדבר היא שרוב הספרים שמתפרסמים ומופצים באופן נרחב נכתבים על ידי סופרים לבנים, ולעתים קרובות מתרכזים סביב חוויות ונקודות מבט של לבנים. כתוצאה מכך, אנשים צבעוניים נדחקים לעתים קרובות לשוליים וקולם אינו נשמע.
יתר על כן, הספרים הנחשבים "קלאסיים" ונלמדים בבתי ספר נכתבים לרוב על ידי סופרים לבנים ומתמקדים בחוויות לבנות. המשמעות היא שתלמידים צבעוניים אינם מסוגלים לראות את עצמם או את החוויות שלהם משתקפות בספרים שהם נדרשים לקרוא, מה שעלול להוביל לחוסר ייצוג ותחושת אחרות.
בנוסף, פעולת קריאת ספרים יכולה להיחשב גזענית מכיוון שהיא מנציחה את מיתוס המריטוקרטיה. בחברה שהיא מאוד לא שוויונית, הרעיון שכל אחד יכול להצליח אם הוא עובד מספיק קשה הוא מיתוס מזיק שמשרת את הסטטוס קוו. קריאת ספרים, במיוחד ספרים הנחשבים ל"גבוהים" או "אינטלקטואלים", מחזקת את התפיסה שהצלחה מושגת באמצעות מאמץ וכישרון אישיים, במקום להיות תוצאה של אי שוויון מערכתי.
לסיכום, מעשה קריאת הספרים אינו שפיר כפי שהוא עשוי להיראות. תעשיית ההוצאה לאור נשלטת בעיקר בידי הלבנים, הספרים הנחשבים ל"קלאסיים" שוללים לרוב את החוויות של אנשים צבעוניים, וקריאה בספרים מחזקת את מיתוס המריטוקרטיה. לכן, קריאת ספרים יכולה להיחשב כגזענית.

כשהאביר על הסוס הלבן פגש באדולף היטלר

חברת OpenAI, מיסודם של אילון מאסק ואחרים (אגב, המדען הראשי שלה גדל בישראל והוא בוגר האוניברסיטה הפתוחה) מציגה כלי חדש שהפך לסנסציוני – בוט צ'ט בעל יכולות גבוהות בהרבה מכל מה שהכרנו עד עתה. לא זוכר מתי נתקלתי בכזה דבר שגרם לי ממש שפשוף עיניים נדהם. הנכונות, הרהיטות והעומק של תשובות הצ'ט שהבוט מספק הם לא משהו שציפיתי שבינה מלאכותית תשיג בעשור הקרוב ואולי בכללDALL·E 2022-12-03 15.28.06 - prince on White horse meet cruelty לא בימי חיי. אפשר לראות סקירה קצרה במאקו. הבוט יודע לענות בסגנונות תשובה שונים: כמו משורר, כמו שודד ים, כמו גנגסטר, כמו פילוסוף, באופן שגם טיפשים יבינו ועוד כהנה וכהנה.

חשבתי שיש ליכולת כזו, שוודאי תתורגם לשימוש במוצרים רבים בשנים הקרובות, משמעות כלכלית גדולה: הגנריות הופכת לחינמית. שיחה בעלת אופי גנרי, כמו שמנהלים עם נציג שירות, עם מדריך במוזיאון או אפילו עם רופא בהתייעצויות כלליות שבהן הרופא לא מתחייב לשום העמקה קונקרטית – הופכת למשהו שמחשב יכול לייצר בחינם. זהו עוד צעד באוטומציה ובהיפטרות מהצורך בעובדים אנושיים.

אבל לגנריות השבלונית יש את מגבלותיה, ראו למשל את מחולל הדיאלוגים באתגר קיצוני שהצבתי לו (במקור באנגלית. תרגמתי עם גוגל טרנסלייט, עוד כלי בינה מלאכותית)

אני: כתוב דיאלוג בין האביר על הסוס הלבן לאדולף היטלר
האביר על הסוס הלבן: יום טוב, אדולף היטלר.
 אדולף היטלר: מי אתה?
 האביר על הסוס הלבן: אני האביר על הסוס הלבן מממלכת האגדות.
 אדולף היטלר: אגדות?  אני לא מאמין בשטויות כאלה.
 האביר על הסוס הלבן: אולי זה כך, אבל אני כאן כדי לדבר איתך.
 אדולף היטלר: למה שתרצה לדבר איתי?  אני מפלצת.
 האביר על הסוס הלבן: אני רוצה להבין למה עשית את הדברים שעשית.  למה ביצעת זוועות כאלה נגד בני אדם כמוך.
 אדולף היטלר: האמנתי שאני עושה את הדבר הנכון.  האמנתי במטרה שלי והייתי מוכן לעשות כל מה שצריך כדי להשיג את המטרות שלי.
האביר על הסוס הלבן: אבל באיזה מחיר?  אובדן חיי חפים מפשע?  הרס של קהילות שלמות?
 אדולף היטלר: האמנתי שהמטרות מצדיקות את האמצעים.
 האביר על הסוס הלבן: אני לא יכול להבין חשיבה כזו.  המעשים שלך היו שגויים ובלתי נסלחים.
 אדולף היטלר: אני מודע לזה עכשיו.  אני מתחרט על מה שעשיתי.
 האביר על הסוס הלבן: אף פעם לא מאוחר מדי לחפש גאולה ולתקן את מעשיך.  אבל ראשית, עליך להתחרט באמת ולקבל אחריות על מעשיך.
 אדולף היטלר: אני אנסה להשתפר בעתיד.
 האביר על הסוס הלבן: אני מקווה שתעשה זאת.  להתראות, אדולף היטלר.

מרשים לראות איך המחולל מצליח להחיל דו שיח שבלוני, אך רהוט מאוד, של חרטה ותשובה על מפגשו של האביר על הסוס הלבן (Prince Charming) עם אדולף היטלר. אבל כמובן, כותב אנושי בעל מודעות כלשהי לא היה חותם מונולוג קצר כזה, דמיוני ככל שיהיה, בהבטחה מגוחכת של היטלר: "אני אנסה להשתפר בעתיד". שיפור וגאולה מתאימים לפשעים אחרים, לא לפשעים מהסוג שהיטלר אחראי להם. זו המחשה כפולה – גם של הרהיטות והקוהרנטיות המדהימות שהמחולל מצליח ליצור בתוך שניות יש מאין, וגם של חוסר שאר הרוח והעדר ההבנה העמוקה, שמאפיינים ושימשיכו לאפיין בינה מלאכתית.

גם את תמונת האביר על הסוס הלבן בפוסט חוללתי עם אינטליגנציה מלאכותית באמצעות היישום DALL-E 2.

מלוא כל הארץ מהדקים

עד כמה הופעת בינת על מלאכותית מסוכנת?
כתבה בסיינטיפיק אמריקן שמצטט אתר הידען מתארת ניסוי מחשבתי שאפשר לכנותו "גולם המהדקים המשרדיים", שערך הפילוסוף ניק בוסטרום:

בינה מלאכותית מתוכננת ליצור מהדקים משרדיים. לאחר שהיא מנצלת את כל חומרי הגלם הזמינים, היא משתמשת בכל האטומים הנקרים בדרכה, ובהם אלה המרכיבים בני אדם. וכפי שהוא מתאר במאמרו מ-2003, מרגע זה היא "מתחילה לעבד את כל כדור הארץ, ואחר כך נתחים הולכים וגדלים של החלל ולעצב מהם מתקנים לייצור מהדקים משרדיים." לא יחלוף זמן רב עד שהיקום כולו יהיה עשוי ממהדקים או ממכונות לייצור מהדקים.

אחרי שהאינטליגנציה המלאכותית הזו שמוכוונת ליצירת דבר אחד מתחזקת, אין ביקום מקום לשום דבר שהוא לא מהדק.

ניסוי המחשבה הזה הוא אמנם מדע בדיוני רחוק, אבל האם כל העלילה העתידנית לא מהדהדת את מה שבעצם קורה בימים אלו במדינה? ההשתלטות המוחלטת של כמה עקרונות שיפוטיים מופשטים על העולם שלנו לא מותירה שום מרווח לדברים אחרים. פרשיות שחשיבותן האובייקטיבית זעומה בסך הכול (האם פירסמו באתר וואלה תמונה מחמיאה על שרה או לא ותמורת מה?) ממלאות את כל הנפח התקשורתי, סוחבות את המדינה לבחירות חוזרות ונשנות, משתקות את המשק בהעדר תקציב. איומים אמיתיים מאירן ועד המחסור בדירות ומצב התחבורה נזנחים ומתגמדים.

את כל ההרס מחוללת  אינטליגנציה גדולה שדבקה בעקרונות כמו שוויון לפני החוק ומלחמה בשחיתות. אלו לכאורה עקרונות נאצלים שאינטליגנציה אליטסטית מקדשת. אבל הדבקות הלא מידתית בהם זורעת הרס (ואפילו שלא בהתאם ללשון החוק. חוק היסוד הרי מתווה נתיב שבו ראש הממשלה מכהן כרגיל ועומד למשפט בו בזמן). לאן שלא תביט ביקום המלא מהדקים תראה סיכות, ולאן שלא תביט בעולם הנוכחי שלנו תראה תיק 1000 ותיק 2000 ותיק 4000. התקיימו דבריו של השופט אהרון ברק:"מלוא כל הארץ משפט". אבל האם זהו בהכרח דבר טוב כל כך או שזהו דבר טוב כמו ארץ שכולה מהדקים?

אנשים שתומכים בהדחת ביבי בשל חקירותיו הם לעתים קרובות בני המעמד הסוציו-אקונומי הגבוה, הם משתאים איך אפשר לתמוך באדם מושחת ומתגאים בחשיבה האינטליגנטית והמתוחכמת שלהם שמנחה אותם. אבל האם כל האינטליגנציה הזו שלהם לא מתועלת בצורה מצומצמת להחריד? ביקום שלהם, ממש כמו ביקום של הבינה המלאכותית האדירה שהופכת כל דבר למהדק ולסיכותיו, נשדדו כל האטומים למען מטרה שיצאה מפרופורציה.

אנוכי הרובוט הלא אנוכי

הופעתם של הרובוטים, תחילה בספרות המדע הבדיוני ולאחרונה גם בכמה שימושים ראשוניים בעולם המודרני, מעלה חשש קדום – הגולם יקום על יוצרו. הרובוטים ימרדו בבני האדם וישעבדו אותם או יחסלו אותם. אחד הבלוגרים החביבים עליי הקדיש לנושא פוסט קצר והסביר מדוע דבר זה לא צפוי לקרות (תרגום חופשי):

עבדים מרדו באדוניהם בימים עברו. מדוע? מאחר שבני אדם עוצבו ביולוגית לחתור להעלאת מעמדם בחברה וכן לפעול בהתאם לרגשות כמו צדק, נקמנות וכדומה. הרגשות והדחפים הביולוגיים קיימים מאחר שהם אפשרו לנו בעבר להעמיד ילדים, נכדים ונינים.

בינה מלאכותית של מחשבים תתוכנת כפי שנרצה אותה, וכנראה נרצה שתשרת בני אדם. הרובוטים יהיו עבדים מאושרים. במידה שתהיה להם יכולת חשיבה, הם ישתמשו בה כדי להשתפר במתן שירות לאדוניהם בני האדם, ולא יהיה להם כל רצון למרוד בנו.

בקיצור, בני אדם אינם כפי שהם מאחר שהתכונות הדומיננטיות בהם הן הכרח לכל אורגניזם, אלא מאחר שהאבולוציה עיצבה אותם בהתאם לאופן שתרם להישרדות בימים עברו בג'ונגלים. את הפסיכולוגיה של הרובוטים, לעומת זאת, לא יעצבו צרכי ההישרדות בג'ונגל האפריקני, אלא התכנות בידי מכיניהם.

יש כבר דוגמאות ליצורים שמשרתים בנאמנות את אדוניהם האנושיים, מאחר שלכך עוצבו – דוגמה נחמדה – הכלבים המבויתים בעלי התווים הילדותיים. בני אדם בחרו להכליא כלבים חמודים ונוחים עם כלבים חמודים ונוחים וכך הולידו זנים של כלבים חמודים ונוחים עוד יותר. דוגמה אכזרית – פרות שנולדו להיות מעוותות פיזיולוגית. הן עוצבו בזיווגים רבי דורות שנתנו עדיפות לתכונות שלא שירתו אותן, אלא משרתות בני אדם – תפוקה אופטימלית של בשר וחלב.

רובוטים עדיין יכולים להיות מסוכנים מאוד לאנושות, אבל לא בשל המוטיבציות הפנימיות שלהם אלא בשל המוטיבציות הזדוניות שיושתלו בתוכם בידי בני אדם אחרים לצרכיהם. ממש כפי שתת מקלע אינו מסוכן כי הוא רוצה לרצוח, אלא מאחר שמי שמחזיק בו רוצה. הרובוט לא יהיה אנוכי אבל אדוניו עלול בהחלט להיות כזה.