מתוק מדבש

אני חולה על תאנים. משוגע על תאנים. מטורף על תאנים. העונה עכשיו בעיצומה, אז לכו לטבע (ומי שלא יכול או לא בא לו אז לכו לשוק)  ואכלו את המתוק מדבש הזה. אבל תאנים לא אוכלים סתם כך. יש שיטה. והנה קטע נהדר מתוך יונה ונער (הנהדר כולו) של מאיר שלו:

היא חצתה כל תאנה לשתיים, חצי אחד נתנה לי ובחצי האחר נגסה, והסבירה לי כי תאנים נבדלות זו מזו בטעמן, גם אם גדלו על עץ אחד. "משולם אמר לי שלא יפה שמישהו אחד יקבל תאנה טובה ומישהו אחר יקבל תאנה רעה, וצריך לחלק כל תאנה בין השניים שאוכלים."
"ואם שלושה אוכלים?" שאל בנימין בבוז כשסיפרתי לו את מה שאמרה.
"ואם שלושה אוכלים?" שאלתי אותה.
"תגיד לאחיך שתאנים אוכלים רק בזוג."

הרביעיה של אנסקומב

מכירים את הסיפור על הסטטיסטיקאי שטבע בבריכה שהעומק הממוצע שלה הוא עשרים ס"מ? בואו להכיר את הסיפור כולו, כפי שסופר על ידי הסטטיסטיקאי האנגלי פרנסיס ג'ון אנסקומב, ושנקרא על שמו: הרביעיה של אנסקומב.

הרביעיה המדוברת מורכבת מארבע קבוצות של נתונים אשר להן מאפיינים סטטיסטיים פשוטים זהים. ברם, הן נראות שונות מאוד זו מזו כאשר הן מצויירות על גרף. כל קבוצה מורכבת מ-11 נקודות, כאשר כל נקודה היא זוג סדור. אנסקומב ייצר את הקבוצות הללו כדי להדגים את החשיבות של הצגת נתונים באופן גרפי בטרם ניתוחם הסטטיסטי ואת ההשפעה שיש לנקודות קיצון על מאפיינים סטטיסטיים.

אבל מספיק עם הדיבורים. הגרפים הבאים יסבירו את הרעיון:

הרביעיה של אנסקומב

הגרפים נראים שונים כל כך למרות שלארבע הקבוצות דלעיל מאפיינים סטטיסטיים זהים! ואילו הם:

  • ממוצע ערך x הוא 9.
  • שונות x היא 10.
  • ממוצע y הוא 7.5
  • שונות y היא 3.75
  • מתאם בין x ל-y הוא 0.816
  • הרגרסיה הלינארית היא: y=3+0.5x

לקריאה נוספת: Anscombe's quartet