Épisodes

  • [147] הוגן או מדויק עם נורית כהן אינגר
    Jan 25 2026

    דאטה סיינטיסטים יספרו לנו בהתלהבות על איך הם פותרים class imbalance, אך מה לגבי imbalance של משתנים דמוגרפיים?


    השבוע באקספליינבל, אירחנו בשנית את נורית כהן אינגר כדי להבין האם מודל שאינו הוגן יכול להיות מדויק. נזכרנו בסקנדל של מודל COMPAS לחיזוי פשיעה חוזרת של עצורים בארה״ב, שחזה false positives פי 2 בקרב אוכלוסיה אפרו-אמריקנית.

    עמדנו על ההבדלים בין הוגנות קבוצתית לבין הוגנות אינדיבידואלית, ואיך לעצב מודל הוגן יותר בשלב הדאטה, האימון, והריצה. אז מודדים היום הוגנות של מודלי שפה? האם פייריות היא פיצ׳ר או מטריקה? ואיך מייק והילה הצליחו להשמיץ שוב את שיטת SMOTE? כל זאת ועוד - בפרק!





    Afficher plus Afficher moins
    26 min
  • [146] ההאקרים שעוזרים לסם אלטמן
    Jan 11 2026

    כדאטה סיינטיסטים, אנחנו מאוד רגישים ל Jailbreaking וחולשות במודלי שפה, עד כדי כך שאנחנו עלולים לשכוח שהמוצרים שאנחנו בונים פגיעים גם לחולשות אבטחה סטנדרטיות.

    השבוע בexplAInable הזמנו את רועי פז, Principal AI Security Researcher שמקבל צ׳קים כדי למצוא פגיעויות באפליקציות LLM. הבחנו בין חולשות במודל לחולשות אפליקטיביות, הגדרנו מונחי בסיס כמו Sandbox, Lateral Movement, וניסינו להבין מה המוטיבציה של חברות כמו OpenAI לתגמל האקרים ולשלם להם כסף על פגיעויות שהם מוצאים במודל.

    שמענו גם על אייג׳נטים שעוזרים להאקרים לכתוב מתקפות מתוחכמות יותר, ועם אלו חולשות אין לנו סיכוי לקבל צ׳ק בתוכניות Bug Bounties של מודלי שפה גדולים. כל זאת ועוד - בפרק!

    לינקדאין של רועי פז: https://www.linkedin.com/in/roy-paz/

    תוכנית הבאג באונטי של OpenAI שכבר שילמה ל330 האקרים: https://bugcrowd.com/engagements/openai


    Afficher plus Afficher moins
    27 min
  • [145] פרק סיכום שנת 2025
    Dec 31 2025

    בשבוע האחרון של שנת 2025 אנחנו ממשיכים את מסורת סיכום השנה שלנו. אורי והילה תהו אם חזרנו להיות סטטיסטיקאים, למה code generation נהיה מעולה אבל פילטר הספאם של גוגל עובד פחות טוב, ומה הקשר בין הבייסליין החדש בכתיבת אימיילים לעריכת וידאו.

    הכרזנו על השנה כשנת ה-consolidation, תהינו מה התרומה שלנו כ- Data Scientists להנדסת AI, והאם בשנת 2026 נתחיל לפגוש ביוזרים סינתטיים. כל זאת ועוד - בפרק!


    Afficher plus Afficher moins
    21 min
  • [144] מדיה גנרטיבית בגוגל עם שי אלון
    Dec 23 2025

    השבוע בexplAInable, אירחנו את שי אלון, אוונגליסט סטארט-אפים בגוגל קלאוד ושמענו על הכלים השונים למדיה גנרטיבית (בעיקר תמונות ווידאו) מבית היוצר של גוגל. ניסינו להבין מה הקשר בין אורך ה-Context Window לסרט הוליוודי באורך מלא, איך ההתחלה מייצור ה-ending frame מעלה את איכות הסרטונים, מה גרם ל Notebook LM להפוך ממוצר נסיוני להצלחה מסחררת, וגם איך נוכל להשתמש בכלים האלו בעצמנו.

    הקורס של שי: https://cloudonair.withgoogle.com/events/startup-school-ai-q4-2025?utm_source=podcast&utm_medium=shaialon

    הלינקדאין של שי: https://www.linkedin.com/in/shaialon/

    00:00 היי שי!

    01:13 מה בתפקיד evangelist בגוגל קלאוד

    02:30 מדיה גנרטיבית בגוגל

    05:22 האתגרים וההזדמנויות בג׳נרוט של וידאו

    15:25 על Notebook LM- מסטארט-אפ פנימי לפודקאסט ששמועים ברכב

    23:21 על deep research של גוגל

    27:00 הקורס של שי על מדיה גנרטיבית


    Afficher plus Afficher moins
    38 min
  • [143] זוויות של בינה מלאכותית עם ד״ר אלישע רוזנצוויג
    Dec 15 2025

    השבוע ב-explAInable, ניסינו להבין האם ל-LLM יש בינה אמיתית, יחד עם ד״ר אלישע רוזנצוויג, חוקר בדיקטה ומנחה הפודקאסט ״אלישע והזוויות״.

    ניסינו להבין אם מבחן טיורינג הוא פרוקסי רע למדידת בינה מלאכותית, איך רלטיביות של ייצוגי embeddings קשורים למעגליות בהגדרות מילוניות, ואיך חוק גודהארט על תבניות סטטיסטיות חזה את זה ש- LLMs ידעו לשקר לנו בצורה מהימנה יותר.


    האם ה-LLMs שאנחנו מכירים היום יצליחו לקדם אותנו לעבר AGI? האם מולטי-מודאליות יעזרו לנו להגיע לבינה אמיתית? ואיך רבנים יכולים להשתמש כבר היום במערכות RAG על פסיקות קודמות? כל זאת ועוד- בפרק!


    Afficher plus Afficher moins
    49 min
  • [142] השקרים שUMAP מספר לנו
    Dec 8 2025

    למה תמיד כשאנחנו משתמשים בUMAP, קלאסטרים עם אותה כמות נקודות נראים באותו הגודל?

    השבוע ב-explAInable, מייק והילה צללו לשיטת הויזואליזציה UMAP, שנחשבת לחדשנית ביותר בתחום ומשמשת רבים מאיתנו בהדמיה של נתונים ממימד הגבוה למרחב הטלה של דו-מימד (או תלת-מימד). ניתחנו את משמעות השם של השיטה, ובדקנו איך הנחת התפלגות האחידה שלנו המהווה את הבסיס להטלה במימד הנמוך יכולה לשבש לנו את התוצאות.

    האם אנחנו באמת יכולים לסמוך על צפיפות הנקודות במרחב ההטלה, האם יכול להיות שאנומליות ימסו לנו לקלאסטרים המרכזיים? כל זאת ועוד - בפרק!

    לינק לקוד הפתוח של UMAP, שכולל הטמעה של densMAP:

    https://github.com/lmcinnes/umap

    לינק למאמר של UMAP בארכיב (עדכון אחרון של המאמר ב-2020):

    https://arxiv.org/abs/1802.03426

    בואו להתארח אצלנו כמומחים בפרקים הבאים:

    https://forms.gle/JQM2zTmeY6cp58AA9

    פרקים

    00:00 מתי קווים מקבילים יפגשו?

    00:51 היי UMAP, שמור לי על שכנים קרובים ונקודות רחוקות בבקשה!

    02:26 החשיבות העסקית של ויז׳ואליזציות בעלות משמעות

    03:19 עושים decoding לשם השיטה.

    04:55 איך UMAP עובד מתמטית

    07:54 אוי לא, הנחת ההתפלגות האחידה מסבכת אותנו!

    08:46 האם הויזואליזציות שאנחנו מייצרים משקרות לנו?

    11:00 שיפורים של UMAP להתמודדות עם צפיפות משתנה



    Afficher plus Afficher moins
    17 min
  • [141] מולטי-מודאליות ב-IBM: איך מאמנים מודלי Vision-Language, עם ד״ר אלי שוורץ
    Dec 1 2025

    השבוע ב-explAInable אירחנו את ד״ר אלי שוורץ, מנהל קבוצת בינה מלאכותית מולטי מודאלית ב-IBM. ניסינו להבין את חשיבות המולטי-מודליות, למשל בעבודה עם מסמכים הכוללים טבלאות ותמונות, והבנו מה מקומם של מודלים קטנים יותר. אז מהם שלושת הרכיבים בארכיטקטורה שמאפשרים הטלה של תמונות במרחב הטקסט? למה מייק מאמין במודלים קטנים? והאם העתיד נמצא דווקא במודלי דיפיוזיה? כל זאת ועוד- בפרק!

    לפרק ביוטיוב: https://youtu.be/AXj6VLAzYEM

    ללינקדאין של אלי: https://www.linkedin.com/in/elischwartz/

    למאמר: https://arxiv.org/abs/2502.09927

    למודל הפתוח: https://huggingface.co/ibm-granite/granite-vision-3.3-2b

    בואו להתארח אצלנו כמומחים בפרקים הבאים: https://forms.gle/tUArnguwPU5KFNKx5

    Afficher plus Afficher moins
    37 min
  • [140] סלאשרים של בינה מלאכותית: איך המובילים בתעשייה שלנו משלבים חדשנות מחקרית עם נורית כהן אינגר
    Nov 24 2025

    השבוע ב-explAInable אירחנו את נורית כהן אינגר, דירקטורית Data Science בלושה, ודוקטורנטית בפקולטה למדעי המחשב ומידע בבן-גוריון. ניסינו להבין את המחויבות של מובילים בתעשייה להישאר מעודכנים בחזית המחקר, ובעיקר - איך מצליחים לעשות ״גם וגם״. אז איך תחרות בקאגל יכולה להוביל לשינוי קריירה? איך מייק מצליח לקרוא מאמר כל יום? והאם הטמעה של מערכות ריבוי-סוכנים (multi-agents) זה הכל עניין של קונטקסט אנג׳ינירינג? כל זאת ועוד- בפרק!

    ללינקדאין של נורית
    בואו להתארח אצלנו כמומחים בפרקים הבאים

    Afficher plus Afficher moins
    42 min