"רעידת אדמה": מי עומד מאחורי צ'אט ה-AI שמטריף את הרשת

מודל בינה מלאכותית אנונימי צץ ברשת וגרר חרושת שמועות לגבי העומדים מאחוריו • המומחים נלהבים מיכולותיו, בהן התמודדות עם שאילתות שמודלים אחרים מתקשים איתן • ההשערות בענף: זו הכנת קרקע לשיתוף פעולה בין OpenAI לאפל או "הטרלה" של אילון מאסק

אילוסטרציה: טלי בוגדנובסקי, חומרים: Shutterstock, הטוויטר של סם אלטמן
אילוסטרציה: טלי בוגדנובסקי, חומרים: Shutterstock, הטוויטר של סם אלטמן

בימים האחרונים הרשת סוערת בעקבות מודל AI חדש ודי אנונימי, עם יכולות מרשימות למדי. ברשת מעלים קונספירציות לגבי מי עומד מאחורי הצ'אטבוט החדש - ונראה שהעקבות מובילות הישר לשמות החמים ביותר בשוק בינה המלאכותית: OpenAI וסם אלטמן. הקונספירציות הרחיקו עד הכנת הקרקע לשיתוף פעולה אפשרי עם אפל.

שתי מניות שבבים פרסמו אתמול דוחות. איך הגיבו המשקיעים?
אחרי טיקטוק, ארה"ב בדרך לחסום את פעילות ענקית הרחפנים הסינית 

באתר LMSYS Chatbot Arena, שמשמש להשוואת מערכות בינה מלאכותית, עודכן מודל חדש שמקורו לא ידוע בשם gpt2-chatbot. ברשת עלו דוגמאות רבות המראות יכולות חזקות במיוחד של המודל שעוקפות את GPT 4, המודל העדכני והחזק ביותר של OpenAI עד כה. משתמשים ברשת החמיאו למודל והראו יכולות מתקדמות שלו בעולמות ה-reasoning. עוד ציינו שהוא מצליח להתמודד עם שאילתות מאתגרות שמודלים אחרים מתקשים איתן. אחד המשתמשים אף הראה שהמודל מצליח לענות על חידה, שלדבריו "רק מעט" מודלים אחרים הצליחו להשיב עליה. משתמשים אחרים אמרו כי למודל יש כישורי ביטוי יותר אנושיים וכשירות מתמטית טובה יותר.

מה אנחנו יודעים על הצ'אטבוט המסתורי?

השם מרמז על המקור
שם המודל, gpt2-chatbot, מתייחס למודל GPT 2 שעליו הוא ככל הנראה מתבסס

יכולות מרשימות למדי
יכולות שתואמות למודל GPT 4 ולא נופלות מהציפיות ממודל GPT 5 המתקדם, שעדיין נמצא בפיתוח

מותאם לצרכי ענקיות הטק
מודל קטן במיוחד שיכול לעבוד גם על חומרה פשוטה, למשל סמארטפונים

שמועות וסברות ברשת
יש שמעריכים שזו הטרלה של אילון מאסק לקראת מודל חדש שהוא מפתח, ויש מי שבטוחים שזה בלון ניסוי של OpenAI

כאמור, לא ברור מי עומד מאחורי המודל, אבל השם שלו מתייחס ל-GPT 2 של OpenAI, מודל שפה שקדם למודלים שבשימוש היום (GPT 3 ו-GPT 4) - שעליהם מבוססים כלים כמו ChatGPT. בחלק מהדוגמאות שרצות ברשת המודל עונה בעצמו שהוא מבוסס על מודל GPT 4 של OpenAI, מה שמתדלק עוד קונספירציות - כי אין סיבה אמיתית לקרוא לו GPT 2.

מערכת היחסים המורכבת בין העיתונות לבינה המלאכותית | עוד זווית

מערכת היחסים בין הבינה המלאכותית לעולם העיתונות לא פשוטה, וייתכן שאף תגיע בעתיד לסיבוכים קשים במיוחד. שתי כותרות מהימים האחרונים מצביעות בדיוק על זה, הטוב והרע - גם יחד: בצד החיובי, הפייננשל טיימס (FT) הכריז בימים האחרונים על שותפות אסטרטגית והסכם רישוי עם OpenAI, כדי לאפשר לחברה לשפר את המודלים שלה עם תוכן מבוסס ורשמי. התועלת של המודלים תשופר לאור שילוב קטעי העיתונות וכן יתאפשר פיתוח מוצרים ופיצ'רים עבור קוראי העיתון.

במסגרת השותפות, משתמשי ChatGPT יוכלו לראות סיכומים, ציטוטים וקישורים בתגובה לשאילתות רלוונטיות. בנוסף לכך, גוף החדשות הפך ללקוח של ChatGPT Enterprise ורכש גישה לכל עובדי החברה כדי להבטיח שהצוותים יוכלו להפיק תועלת מהכלים של חברת הבינה המלאכותית.

"מחויבים לעיתונות אנושית"

הבינה המלאכותית הביאה איתה חשש שמא היא תחליף עובדים בשוק העבודה, וגם עיתונאים נמצאים ברשימה. מנכ"ל קבוצת FT, ג'ון רידינג, אמר כי "ההסכם מכיר בערך העיתונות עטורת הפרסים של החברה, וייתן לנו תובנות מוקדמות לגבי האופן שבו תוכן מוצג באמצעות בינה מלאכותית". לכך הוסיף כי "אנחנו מחויבים לעיתונות אנושית שהופקה על ידי חדר החדשות שלנו ללא תחרות, והסכם זה ירחיב את טווח היצירה, תוך העמקת ההבנה שלנו לגבי דרישות ותחומי עניין של הקוראים".

לפי הדיווחים, OpenAI חתמה על הסכמים דומים גם עם ענקית ההוצאה לאור הגרמנית אקסל ספרינגר, המחזיקה בביזנס אינסיידר ופוליטיקו, וגם עם סוכנות הידיעות AP.

טענות לפגיעה בזכויות יוצרים

עם זאת, ישנן גם מערכות עיתונות שלא מסכימות שיעשה שימוש כזה רחב במידע שלהן בלי אישור. שמונה עיתונים יומיים בבעלות של MediaNews Group ו-Tribune Publishing, חברות בת של Alden Global Capital, תובעים את החברות מיקרוסופט ו-OpenAI בטענה שעשו שימוש לא חוקי במאמרים ובכתבות שלהם כדי לאמן ולהפעיל את הצ'אטבוטים שלהן. בין העיתונים שברשימה: ניו יורק דיילי ניוז, שיקגו טריביון, אורלנדו סנטינל ודנוור פוסט.

התלונה הוגשה לבית המשפט במחוז הדרומי של ניו יורק, ובה טענו העיתונים שנעשה שימוש במיליוני מאמרים שמוגנים בזכויות יוצרים. טענת הליבה הייתה שהצ'אטבוטים לקחו את המידע ממאמרים שנמצאים מאחורי חומת תשלום, וכך למעשה זה הפחית את הצורך של הקוראים לעשות מנוי ולתמוך בעיתונות מקומית.

אלו מצטרפים לתביעה מתוקשרת נוספת מדצמבר האחרון: הניו יורק טיימס תבע את שתי החברות על כך שעשו שימוש נרחב במאמרים המוגנים בזכויות היוצרים. מיקרוסופט ו-OpenAI טענו בתגובה שהטיימס לא הראה נזק ממשי, וכי הדגמים האלו לא באמת החליפו את הכתבות החדשותיות.

נבו טרבלסי

בשוק בטוחים: "בשורה משמעותית"

יש הטוענים שמדובר בחלק מהטרלה של אילון מאסק, במסגרת פרסום עתידי של הדור הבא של המודל עליו הוא עומל. לצד זאת, יש השערות שמדובר בבלון ניסוי של OpenAI כדי לבחון את GPT 5. תגובת סם אלטמן לדבר הייתה ציוץ כי "יש לי מקום חם בלב בשביל GPT2" - מה שיכול לרמז על קשר עקיף של OpenAI למודל המדובר.

"חלק מהסברות הן שזה באמת GPT 2 שאומן על מידע עדכני יותר, והכניסו את כל הטריקים והידע שנצבר עד היום. זה חלק מהבשורה", מסביר אורי אליאבייב, יועץ בתחום הבינה המלאכותית ומנהל קהילת Machine and Deep Learning Israel. הסיבה שזו בשורה משמעותית לפי אליאבייב היא כי GPT 2 הוא מודל קטן במיוחד, וזה אומר שהוא מקבל שדרוג רציני משנת 2019.

כך או כך, לאחר חרושת השמועות והקונספירציות המודל ירד מהמערכת של LMSYS וכעת אין אפשרות להתנסות בו.

העניין במודלים הקטנים הולך וגובר

לדברי אליאבייב, "אם הם הצליחו לקחת מודל קטן במיוחד ולגרום לו להגיע לרמות של GPT 4 זו חתיכת רעידת אדמה. ראינו הרבה מודלים קטנים שמנסים להגיע לרמות גבוהות. אם הם מצליחים להוכיח שזה אפשרי - זה משנה את כללי המשחק". הוא מסביר שזה כה חשוב מכיוון שההבדל בין מודל גדול או קטן, זו היכולת להריץ ואיפה: "מודל גודל דורש כוח חישוב רב, גם לאימון וגם להרצה. יש כיום התעניינות במודלים קטנים יותר. אפל ומיקרוסופט לדוגמה רוצות לאפשר למודלים לרוץ על חומרה פשוטה כמו סמארטפונים, ולכן יש מאמצים כיום לפתח מודלים כאלה".

ל-OpenAI אין מודלים קטנים כי זה לא באמת מעניין אותה, היא לא מחפשת בהכרח לרוץ באופן מקומי על מכשירים. מה שכן, לדברי אליאבייב, ייתכן שאנחנו מקבלים הצצה לבלון הניסוי של OpenAI כדי להשיג את העסקה עם אפל. "קשה לדעת, אבל אם באמת OpenAI עומדת מאחורי זה, אז זה כדי לבחון ולהצדיק את השת"פ העתידי עם אפל, כדי להכניס בינה מלאכותית לאייפון הבא. כדי לעשות את זה אפל יצטרכו מודל קטן".