Grok לעומת ChatGPT: מה עדיף?

היריבים הגדולים ביותר מתמודדים זה מול זה

הקרב לא יכול היה להיות לוהט יותר – אילון מאסק, מייסד שותף של OpenAI, ידוע כיום בזכות טסלה, SpaceX, רכישת טוויטר (כיום X) וגרוק, הצ'אטבוט הבינה המלאכותית של הפלטפורמה.

סכסוך הוביל את מאסק לעזוב את דירקטוריון OpenAI שנים לפני ש-ChatGPT הפך לשם דבר, אך כיום, שתי הפלטפורמות נמצאות בחזית החדשנות בתחום הבינה המלאכותית.

רבים משבחים את טסלה על היותה מכוניות החשמליות הטובות והמתקדמות ביותר שקיימות, אך האם גרוק יכולה לשאת תואר דומה לזה שהיא לוקחת על עצמה את ChatGPT?

הבדיקות

רב-מודאלי הוא שם המשחק כאן, כי ChatGPT ו-Grok יכולים לעשות גם את הצפוי (כלומר, ליצור טקסט) וגם את החדש (ליצור תמונות).

אינכם צריכים עוד לחפש פלטפורמות שונות עבור בקשות הבינה המלאכותית השונות שלכם, כעת, כאשר Grok ו-ChatGPT יכולים להתמודד עם הכל.

יצרנו סדרה של שש שאלות עבור מערכות הבינה המלאכותית המובילות הללו כדי שיוכלו להתחרות זו בזו: הסבר עובדתי, משוואה מתמטית, בקשה רחבה יותר לעצה, בקשה פתוחה, ביטוי יצירתי ויצירת תמונה מותאמת אישית לחלוטין.


 

"להסביר כיצד נוצרים עננים"

גרוק מול צ'אטGPT

המטרה הייתה שגרוק וצ'אטGPT יפרקו את תהליך היווצרות הענן לשלבים שאפילו ילד אמור להבין, ושניהם עמדו בדרישות.

שתי המערכות סיפקו תהליך שלב אחר שלב, שנכתב בפשטות בנקודות תבליט, ופירטו כמה מסוגי הענן שאנו עשויים לראות.

ChatGPT נתן דוגמה נוספת לסוג ענן, שאינה מופיעה כאן ולא שם, אך הוא גם סיכם את כל מה שנאמר לפסקה קלה להבנה כדי לסכם את הדברים.

גרוק 0 – צ'אטGPT 1

"מהו (2+2)(7-7)"

גרוק מול צ'אטGPT

אהבתי את סוג השאלות הזה בבית הספר – סוגריים כפולים נראים ממש מפוארים, אבל אם יודעים איך להתמודד איתם, הם קלים מאוד לחישוב. האם בינה מלאכותית יכולה לפתור את זה, בכל אופן?

התשובות הארוכה והקצרה הן שתיהן כן. הם פירקו את שני חלקי המשוואה כדי להסביר כיצד הגיעו לתשובותיהם; אותן תשובות.

זה לא יכול להיות יותר שחור ולבן מזה – הכל אחד.

גרוק 1 – צ'אטGPT 1

"כמה כוח אמור להיות למכונית שלי?"

גרוק מול צ'אטGPT

זו שאלה הרבה יותר מסובכת כי אין נכון או לא נכון. קיוויתי שהצ'אטבוטים יעזרו לי לקבל החלטה מושכלת.

שניהם ניתוח תפוקות כוח של מכוניות שונות לפי שימוש וכללו גורמים משפיעים כמו צריכת דלק.

התשובה של גרוק הייתה מושלמת עבורי, כי הצ'אטבוט של X-run העלה גם שיקולים נוספים שמשפיעים על הביצועים, כמו אווירודינמיקה וסוג תיבת ההילוכים. מכונית קופה עם 300 כ"ס אינה זהה לרכב שטח עם 300 כ"ס, וגרוק ידע זאת.

כמו כן, היא הצליחה לצטט מקורות, שכללו X פוסטים. כאשר דעות נכנסות לתמונה, הגישה של גרוק למשאב אינסופי של דעות היא בעלת ערך.

גרוק 1 – צ'אטGPT 0

"כתוב מסלול טיול לסוף שבוע באתונה"

גרוק מול צ'אטGPT

הייתי צריך לתת אחת הערים האירופאיות האהובות עליי לשניים מהצ'אטבוטים הטובים והבולטים ביותר שיש, ושניהם חזרו אליי עם מסלול מפורט המחולק לפי בלוקי זמן.

שניהם שקלו ארוחות, אך אף אחד מהם לא הזכיר לינה, וזוהי טעות מצערת.

ChatGPT הוסיף קצת היסטוריה והקשר לגבי הסיבות שאולי ארצה לבקר באתרים מסוימים, אבל Grok לקח את זה צעד קדימה וסגר לחוויה אישית יותר על ידי ייעוץ לי מתי להימנע מאזורים מסוימים ומתי מתקיימים האירועים הטובים ביותר.

גרוק 1 – צ'אטGPT 0

"כתוב תסריט קצר למדיטציה"

גרוק מול צ'אטGPT

החיים במאה ה-21 יכולים להיות כאוטיים, ועובדים רבים ממקסמים כעת את הפרודוקטיביות שלהם בעזרת בינה מלאכותית, אבל האם בינה מלאכותית יכולה גם לעזור לנו להירגע?

שניהם הפיקו תסריט קצר, באורך של כשתי דקות, אבל זה של גרוק הרגיש קצת יותר מודע ונוכח.

מדיטציה ומיינדפולנס יכולות להיות סובייקטיביות, אבל הרגשנו שהתסריט של גרוק היה בעל המשיכה הרחבה ביותר.

גרוק 1 – צ'אטGPT 0

בונוס: "צור תמונה של סוס רוכב על אופניים"

גרוק מול צ'אטGPT

יצירת תמונות היא המקום שבו בינה מלאכותית באמת בולטת – סידור מילים הוא קל, אבל יצירת תמונה ייחודית לחלוטין דורשת הרבה יותר הקשר ועיבוד. במיוחד כשהיא לא סבירה כמו סוס רוכב על אופניים.

גרוק יצא לדרך על ידי יצירת ארבע אפשרויות נפרדות בו זמנית תוך 23.51 שניות. אפשרויות מרובות זה נהדר, אבל המציאות היא שאף אחת מהן לא הייתה שמישה.

ChatGPT היה מהיר יותר, עם 13.73 שניות, אבל הוא יצר רק אפשרות אחת בפורמט פחות מציאותי, יותר דמוי קריקטורה. לפחות זו הייתה מדויקת ושמישה.

גרוק 0 – צ'אטGPT 1

ChatGPT לעומת Grok: מה הכי טוב?

גרוק 4 – צ'אטGPT 3

לכל צ'אטבוט מבוסס בינה מלאכותית יש מקרי שימוש משלו, אבל עבור הרובוט הטוב ביותר, גרוק ביצע ביצועים טובים בארבעה מתוך ששת המבחנים שהוא עבר, מעט לפני ChatGPT.

הוא משתמש ב-LLM משלו בתוספת גישה לכל מסד הנתונים של X פוסטים, מה שבאמת עוזר להוסיף הקשר מהעולם האמיתי.


להראות יותר

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

Back to top button

זוהה חוסם פרסומות

אנא שקול לתמוך בנו על ידי השבתת חוסם פרסומות שלך