כשמבחן טורינג יחליף קאפצ'ה | בינה מלאכותית ושיווק במדיה חברתית

Posted on 2 במאי 20093 במאי 2009 by יהונתן קלינגר

0. מיהו ווטסון?
IBM החלה בפיתוח מערכת מדהימה, Watson, על שם ג'ון ווטסון האלמנטרי מספריו של סר ארתור קונן דויל, תומאס ווטסון, מייסד IBM, הינה תוכנה (או מחשב) שאמור להביס בני אדם בשעשועון הJeopardy. אכן, אותה חברה שהביסה כבר את גארי קספארוב בשחמט באמצעות Deep Blue, מנסה לפתור עוד כמה בעיות ולענות על "מלך הטריוויה" הקלסאי בו אתה נדרש לענות בצורה של שאלה. למרות שככל הנראה אחוז מסוים מהשאלות ניתן לפתרון על ידי שילוב של גוגל וויקיפדיה, עדיין מדובר בנסיון לא מיותר במיוחד שעשוי להיות מקסים. ושימו לב, ג'פרדי ולא פוקר, מענה לתשובות ולא הקראה של ספרים, האם לכאן מגיעה הבינה המלאכותית שלנו? להגיד לנו איפה שכחנו את המפתחות?

1. מיהו וולפראם?
פרופ' סטפן וולפראם מפתח מנוע חישוב מבוסס ידע תחת השם Wolfram|Alpha. בפוסט שפרסם בבלוג שלו הסביר כי מדובר במהפכה שתגרום למחשבים לשוחח עם בני אדם בשפה אנושית ולענות לצרכיהם. מדובר אולי בהמשך של מה שהיה פעם Ask Jeeves ואולי במערכת שתוכל לסיים סוף סוף את הבעיות עם מבחן טורינג.

2. מהו סווש?
Swush הינו פיתוח של עמרי ידן הישראלי שנועד לעשות בדיוק ההפך. אם במשך שנים בני האדם פיתחו אלגוריתמים מסובכים שנועדו לגרום לאנשים לתקשר עם מכונות, סווש עושה ההפך. מדובר על שפה פשוטה שמאפשרת לך להגיד למחשב שלך מה לעשות. Swush עושה לרשתות הסמנטיות את מה שטוויטר עשה לפייסבוק: בעוד שלפני כמעט עשור דיברו על פורמאט RDF כדי להפעיל רשתות סמנטיות והיו צריכים קבצי XML מסובכים על מנת להגדיר מהו היחס בין כל אלמנט לאחר, הפורמאט של ידן הופך את כל הדיון הזה לדיון בשפת אנוש. גם המחשב וגם האדם יוכלו להבין את אותו תקציר, ולמצוא יחד את אותה פיסת מידע (ועכשיו עמרי יתקן אותי בטוקבקים על כל השגיאות שלי).

3. מהו מדען מטורף?
כבר היום, באמצעות מספיק אוטומאציה, ניתן לבנות תשריטי מחשב שישלחו הודעות אוטומאטיות במענה להודעות בשירות טוויטר או בצורה דומה באמצעות API כזה או אחר: שירות TweetLater, לדוגמא, מאפשר לך לשלוח הודעות אוטומאטיות למשתמשים שהחלו לעקוב אחרייך, ושירות Towollow מאפשר לך לעקוב בצורה אוטומאטית אחרי מי שמזכיר מילים מסוימות. כך, באמצעים אוטומאטיים, ויחד עם כלים כמו TwitterFeed שמזין לך תוכן אוטומאטי לחשבון הטוויטר, ניתן לצור חשבון פיקטיבי של משתמש שיצבור אמינות וישוחח "שיחה משווקת" עם גולשים. טפשות מלאכותית כלשהיא.

4. מהי סינגולריות?
ועדיין, למרות שרובוטים יכולים לעזור לנו למצוא מידע, ואפילו לגלות ידע חדש באמצעות מחקר, קשה לנו להאמין שאלה יוכלו לעבור את מבחן טורניג. בעצם, מרגע שאלו יעברו את מבחן טורינג נגיע לסינגולריות והמחשבים יתפתחו בקצב מהיר יותר מהבינה האנושית. הקיום שלנו, כבני אנוש, לא יהיה ראוי בכלל. ועדיין, חלק ניכר ממחקר הבינה המלאכותית כלל אינו מופנה לכיוון הזה. חלק מהמחקר מופנה לכיצד להרוויח יותר כסף בבורסה או כיצד למכור יותר מוסיקה. אפילו, במקרים מסוימים, הבינה תשמש לדברים טובים יחסית.

5. האם ספאמרים חולמים על כסא חשמלי?
אבל עדיין, בעידן של שיווק על בסיס שיחה, הספאמרים מנסים להזכיר לנו שגם שיחה עם איש מכירות היא שיחה מזויפת. דורון פישלר מביא את דברי הביקורת על Qerta, חברת הטוקבקים האוטומאטית שעושה את מה שתואר בסעיף 3, רק בלי האלגנטיות של האוטומציה: התוכנה שותלת תגובות מטעם ומנסה להזכיר לנו שאין שיחה שחפה מאינטרסים זרים. כעת, מכשהגיע Qerta, אין לנו הרבה ברירה אלא להריץ מבחן טורינג לטוקבקים. אבל עדיין, גם אם מבחן טורינג יחליף את הקאפצ'ה, האם תוכלו לענות בכל כתיבת טוקבק "איך הרגשת כשרצחו את רבין?"

6. מי אני?
האם מרגע שתגיע אותה סינגולריות של לכלוך ברשת נצטרך להתנתק מהמחשב? מאות אלפי ספלוגים שמקבלים מיליוני תגובות בכל שניה מאותן מתחרות של Qerta רק כדי לקדם את המילים הרלוונטיות בתוצאות חיפוש, מיליוני משתמשים פיקטיביים בפייסבוק שמדברים אחד עם השני, יוצרים אירועים פיקטיביים ומנסים לשכנע אחד את השני לרכוש מוצר מסוים? האם לרובוטים יש רצון ורכושנות? האם יוכל המחשב לשכנע את עצמו להפסיק עם מירוץ החימוש הלא-רציונאלי הזה ולחדול מלשווק או שאנחנו נאלץ לצור תשתית בה בני האדם, שטרם הגיעו לסינגולריות, יצטרכו לדבר אחד עם השני באמצעים אנאלוגיים, הרחק מעינם של המשווקים?

18 thoughts on “כשמבחן טורינג יחליף קאפצ'ה | בינה מלאכותית ושיווק במדיה חברתית”

אלון 2 במאי 2009

בתשובה לשאלתך: כן, אבל רק כש the machines become self-aware :)
שי 2 במאי 2009

יפה.

רק דבר אחד – מבחן טורינג הוא מבחן מאד מסויים. יכל להיות שאיזה תוכנה תדע לשתול טוקבקים שמעל 50% מבני האדם ל יידעו לומר שהם מחשב. אבל זה לא מבחן טיורינג. גם אליזה (ההיא מהספר של דוד אבידן) עבדה בטח על לא-מעט אנשים, אבל היא בוודאי לא קרובה ללהיות מורכבת מספיק כדי לעבור מבחן טיורינג.

ביקורת, אגב, גם יש, על זה שתחום הבינה המלאכותית (במיוחד באדמיה) השקיע את עיקר מרצו, מיטב זמנו וטובי המוחות בכמה עשורים האחרונים כדי לעבור מבחן שכלל לא ברור שעונה באמת על מה שבני אדם (וביניהם במיוחד פילוסופים) יסכימו שהוא "אינטיליגנציה".
יהונתן 2 במאי 2009

אלון,
זו סינגולריות.

שי,
אכן. הבעיה היא שכמו הפסיכומטרי, למעט מבחן טורינג אין לנו דרך טובה לדעת האם אני מכונה או אדם. לא?

איך היית מגדיר אינטיליגנציה, אם כן?
נמרוד אבישר 2 במאי 2009

בלי להכנס לשאלות סבוכות כמו "מודעות" וכיו"ב, שיחייבו אותי לצאת דואליסט עם מאפיינים דתיים, אני חושב שקאפצ'ה היא כבר סוג של מבחן טיורינג. הייעוד שלה הוא להבחין בין מכונה ואדם. לצורך העניין, במקום שבו הטוקבקים דורשים קאפצ'ה, qerta היא חסרת תועלת כמו שדיים על פר. הבוט פשוט לא יוכל להשתיל את הטקסט שלו. ומפה אנחנו לומדים משהו מדהים בהרבה: שהמחשב עושה מבחן טיורינג טוב בהרבה מאתנו – תגובה שתעבור מודרטור (כי היא קוהרנטית ורלוונטית ולא נראית לחלוטין כמו ספאם) לא תעבור קאפצ'ה (כי כותב אותה בוט שלא יודע לקרוא את הקאפצ'ה).
יהונתן 2 במאי 2009

נמרוד,
יש לא מעט דרכים לעבור קאפצ'ה, כמו להתקין בעצמך קאפצ'ה באתר פורנו ולדאוג שמי שיענה עליה יגיש לסקריפט שלך את התגובת ספאם.
יחזקאל 2 במאי 2009

מה ששי ונמרוד אמרו. (עיין שם)

להשתמש באנשים כדי לעבור את הקאפצ'ה, דורש העברה שלה בזמן אמת וכו' מה שימנע מחרטא לתזמן את הטוקבקים שלה בשעות הרצויות להם, יש לקוות.

חוששני שאתה גם מבלבל בין מעבר של מבחן טיורינג לבין היכולת של מחשבים "להסתדר בעצמם". ככל הזכור לי, מבחן טיורינג לא דורש מהמחשב יכולות לימוד עצמי מוצלחות במיוחד (מה שמצופה ממחשבים שידעו איך להשתלט על העולם) אלא בעיקר יכולות ניתוח שפה טבעית ראויות ויכולת לענות כמו שצריך גם על דברים שאולי אין בויקיפדיה (כמו רגשות).

נמרוד,
קאפצ'ה היא אולי נגזרת של מבחן טיורינג, אבל מבחן טיורינג אמיתי, אינטראקטיבי, עדיין לא יכול להתבצע ע"י מחשב, אני חושש. (ועי' בתגובה האחרונה בפוסט המלונקק לעיל.)
יחזקאל 2 במאי 2009

אגב, תשריטים יש באדריכלות, למשל, במחשב זה תסריטים.

(למה התגובה הקודמת לא מופיעה, למרות שוו"פ טוען שהיא כבר קיימת? מספיק לינק אחד כדי להיכנס להמתנה בספאם?)
עמרי 2 במאי 2009

תודה על הסיקור יהונתן :)
סווש בא קודם כל לפתור צורך אישי שלי שממש לא קשור לרשתות סמנטיות אלא ליצוג מידע באופן כללי – וספציפית בפורמט שיהיה מתאים לקבצי הגדרות שונים ומשונים.
סווש יכול כמובן להתאים גם כתחליף RDF או פחות או יותר כתחליף XML באופן כללי.
השפה (הפשוטה ככל שניתן) תתאים גם לתקשורת בין מחשבים, אבל היתרון שלה הוא בפשטות, שמאפשרת גם לאנשים רגילים להבין ולשנות קבצים שכתובים בשפה בקלות.
אפי פוקס 3 במאי 2009

מבחינתי, שאלת ה-500$ צריכה להיות: "מהו האח הגדול?".
אם ווטסון עונה תשובה שלא תכלול את ארז טל, אני אשתחווה.

ובאותו עיניין: זה חטא שלא הקדשת טקסט ל-Ubiquity. לא יודע לאן יתגלגל הפרויקט הזה של מוזילה, אבל בינתיים הוא דוגמא נפלאה ליישום (קצת מגמגם) בר קיימא שמנסה לסלול עוד כמה מטרים בדרך לסינגולריות.
http://labs.mozilla.com/2008/08/introducing-ubiquity/
עידן 3 במאי 2009

הבעיה היא כמובן לא Qerta אלא החברות שמשמשות בשירותים ש-Qerta מספקת.
האם קופ"ח כללית (למשל) היתה משלמת למישהו כדי שירסס כתובות גרפיטי עם שמה או איזה סלוגן שלה ברחבי העיר? ברגע שיש חברה שמוכנה לפרסם את עצמה בצורה כזו קשה להאשים את Qerta בזה שהיא מרססת כתובות גרפיטי ברחבי הרשת עבור לקוחותיה.
וזה ש-Qerta עושה את זה באופן אוטומטי ולא מעסיקה עובדים שילכלכו את העיר בשבילה רק גורם ל-Qerta להיראות טוב יותר בעיני. היא מנצלת את הטכנולוגיה טוב יותר מחברות אחרות.
כל הכבוד ל-Qerta על מה שהיא עושה. בוז לחברות שמשתמשות בשירותים שלה.

(וזה לא שאני עובד ב-Qerta או משהו בסגנון. זו סתם הודעה אוטומטית. מה, נראה לכם שמישהו ממש ישב וכתב את התגובה הזו?)
אור שגיא 3 במאי 2009

(לצערי) התוכנה נקראת ווטסון על שם תומס ווטסון (נשיא יבמ לשעבר ..)

http://en.wikipedia.org/wiki/Thomas_J._Watson

למרות שבבירור ארתור קונן דויל היה יותר שווה …
יהונתן 3 במאי 2009

צודק,
זה מוזר מאוד…
pepepere 3 במאי 2009

בעצם למה צריך קאפצ'ה כשמדובר בחברה שפועלת משרתים שאפשר פשוט לחסום את כתובות ה-IP שלהם (או של תת-רשת שהם נמצאים בה)? לא צריך מבחן טורינג כדי לזהות מי שלא מסתתר.

מצד שני: אם נניח שבוט מסוגל לחולל טוקבקים כל כך טוב שאי אפשר להבדיל ביניהם לבין מה שאנשים כותבים, האם זה ספאם? כלומר אם אתה רואה משהו שאינו נראה כמו ספאם, האם זה ספאם? התכונה הבסיסית של ספאם הוא שכשאתה רואה אותו את זה יודע שזה זה (לא הגדרה ישימה כל כך משפטית, אולי, אבל זאת ההגדרה האמיתית של כל מי שמקבל ספאם: "מה שקיבלתי בלי שביקשתי ולא רציתי לקבל"). אם נניח ש-Qerta מצליחה להעביר את מה שהיא מעבירה בלי שאף אחד מזהה את זה או מוצא לנכון להתלונן: האם יש כאן בעייה?

אני לא מת על הרעיון של בוט שמפרסם. רק תוהה אם אני יכול להגדיר את זה כספאם ולהכריז על זה כלא לגיטימי אם אני לא יודע להבדיל בין מה שאני קורא לו לגיטימי לבין מה שלא.
יוחאי 3 במאי 2009

קיום תוכנה שיכולה לבדוק תוצאות של מבחן טיורינג מחייב שאפשרי גם ליצור תוכנה שתזייף את התוצאות עד כמה שאני יודע.

אני לא חושב שיש אפשרות שתוכנה תיצור בעיה שתוכנה אחרת לא יכולה לפתור כדי להבדיל בוטים מבני אדם.
pepepere 3 במאי 2009

אולי בעתיד qerta יכולים לישם משהו דומה למה שמתואר ב- http://tools.ietf.org/html/rfc1097
חיים 4 במאי 2009

תודה מעניין
שי 4 במאי 2009

בעניין הקאפצ'אז – כבר היום יש סקריפטים שמעבירים את הקאפצ'א בזמן אמת לכל מיני הודים. סוג של "החדר הסיני" של סרל, רק במהופך, די משעשע האמת.

אני לא רוצה להיכנס עכשיו לדיון על מהי אינטילגנציה, אנחנו לא נצא מזה. אני חולק על נמרוד שאי אפשר לטפל בבעיות ה"קשות" של תודעה (qualia וכיו"ב) בלי להדרדר לדואליזם, אבל זה לא העניין. העניין הוא שמחד, טיורינג מרדד את השאלה המהותית לשאלה בהביוריסטית ("אינטיליגנטי הוא מי שמתנהג באופן אינטיליגנטי"), ומאידך, המענה לשאלה תלוי בתשובה סטטיסטית של קהילת שפה מסויימת (בדומה לביקורת על קריפקי בסוגיית עקיבה אחר כלל אצל ויטגנשטיין, יש בעיה מהותית עם הפיכת שאלה נורמטיבית לשאלה סטטיסטית).

כיוון שהתשובה לשאלה מהי אינטילגנציה היא חמקמקה, אז גם לא ברור איך לבדוק את זה כשנראה את זה בא לידי ביטוי במקום אחר (זה נוגע לחיזרים כמו לגבי בינה מלאכותית ומי יודע, אולי גם יצורים אחרים בכדוה"א).

בכל מקרה, הניסיון של מדעי הבינה המלאכותית במהלך השנים לחקות התנהגות אנושית הוא לא בהכרח הכיוון הנכון, זה כל מה שאני אומר.
אורן 4 במאי 2009

הערה קטנה (לפני פוסט ארוך) – זה לא חוכמה לכתוב תוכנת טיקבוק ש"תעבור" את מבחן טורינג על ידי זה שאנשים לא ידעו להבדיל בין טוקבקים מלאכותיים לאמיתיים כי הרי גם האמיתיים, חלקם הגדול הוא כה רדוד ועילג עד שהם נדמים כרנדומיזציה של מילות מתח תקועות בטמפלייט לשוני.
ועוד הערה (אני לא יכול להתאפק) – נניח שהם מצליחים לעבור מבחן טורינג ב80% מהמקרים, כלומר לוקחים אוסף תגובות, חלקן "אמיתיות" מכתבות וחלקן שתולות שלהן ונותנים לאנשים להחליט איזו תגובה אמיתית ואיזו שתולה וכשמונים אחוז מהשתולות מסווגות כאמיתיות על ידי הבוחנים האנושיים. כאן מסתתרת ההנחה שבדגימה מהאתר אין תגובות שתולות של חברה מתחרה שלא עושה הרבה רוח (או של טוקבקיסטים שתולים שעובדים עם טמפלייטים). זו הנחה די חזקה ולגמרי לא טריוויאלית. כלומר כל הבדיקה הזו היא בדיחה עצובה.