3.1 תיאור נתונים באמצעות טבלת שכיחויות

     
3.1.1 טבלת השכיחויות של משתנה בדיד
    
  
3.1.2 שכיחות מצטברת, שכיחות יחסית ושכיחות יחסית מצטברת
      3.1.3 טבלת השכיחויות של משתנה רציף 


 3.1.1 טבלת השכיחויות של משתנה בדיד

הסטטיסטיקה התיאורית עוסקת בארגון הנתונים, תיאורם הגרפי, והסקת מסקנות על-סמך חישובים הנעשים על הנתונים האלה. בסעיף זה נעסוק בארגון הנתונים בטבלת שכיחויות.

מדוע צריך את זה? התשובה היא שרוב המחקרים הסטטיסטיים מבוססים על מספר רב של נתונים שהצגתם בסדרה אינה נוחה, ולכן עדיף לסדר ולרכז אותם בטבלה מיוחדת, המכונה טבלת השכיחויות.

בנוסף לסידור שיטתי של הנתונים, טבלת השכיחויות מאפשרת חישוב נוח של מדדים סטטיסטיים שאותם נכיר בהמשך.

הטבלה הבאה מתארת את המבנה הכללי של טבלת השכיחויות עבור משתנה בדיד:  

                          

 

                                         

פעילות באקסל:
בנה טבלת שכיחויות עם הנתונים שבדוגמה, על-פי ההנחיות הבאות:
א. בעמודה
A הקלד את נתוני המשתנה הנמדד.
ב. בעמודה B הקלד את נתוני השכיחויות.
ג. הוסף שורת כותרת לנתונים (בתאים A1, B1 בהתאמה).
ד. חשב את סך התצפיות בתא B8 (השתמשו בפונקצית SUM , וודא שקיבלת את הסכום 16).
ה. שמור את הקובץ בשם "פרק 3". לגיליון עצמו קרא בשם "תעודות הצטיינות".


 
3.1.2 שכיחות מצטברת, שכיחות יחסית ושכיחות יחסית מצטברת


לעתים קרובות לצורך ניתוחים סטטיסטיים דרוש מידע  נוסף בטבלת השכיחויות.
לדוגמה: כמה תלמידים (מבין התלמידים שמצטיינים בספורט) השיגו עד (וכולל) 5 תעודות הצטיינות במשך שנת הלימודים?

התשובה היא: 12 תלמידים=2+4+1+5  





לפני שנציג את טבלת השכיחויות מהדוגמא הקודמת, הכוללת גם את השכיחות המצטברת, השכיחות היחסית המצטברת, היעזרו באקסל כדי לחשב את הערכים הדרושים.  

פעילות באקסל:
א. היכנס לטבלת השכיחויות שבנית בסעיף הקודם.
ב. הוסף עמודה C – שכיחות מצטברת, וחשב את הערכים בעזרת פונקצית SUM.
ג. הוסף עמודה D – שכיחות יחסית. חשב את הערך הראשון בעזרת פונקציה שתגדיר בשורת הנוסחאות.
ד. הוסף עמודה E – שכיחות יחסית מצטברת, וחשב את הערכים בעזרת פונקצית SUM.
ה. ודא שהתוצאות שקיבלת זהות לערכים הרשומים בטבלה הבאה.

 

                           

למעלה

3.1.3 טבלת השכיחויות של משתנה רציף

כדי לבנות טבלת שכיחויות עבור סדרת נתונים המייצגים ערכים של משתנה רציף, נחלק את תחום הערכים  של המשתנה למספר מרווחים המכונים "מחלקות" (או "קבוצות").

למשל, בדוגמה  2 שבסעיף 1.3 ניתן לבחור את המחלקות באופן הבא:
                                                            60-65 (המחלקה הראשונה)
                                                            65-70 (המחלקה השנייה)
                                                            70-75 (המחלקה השלישית)
                                                            75-80 (המחלקה הרביעית)
                                                            80-85 (המחלקה החמישית)

(הערות:  א. ברוב המקרים המחלקות הן בעלות רוחב שווה, אם כי הדבר אינו הכרחי.
               ב.  אין כללים מוגדרים וחד-משמעיים לבחירת מספר המחלקות, אך אל דאגה! במסגרת הקורס 

                   
הזה, בכל בעיה מסוג זה המחלקות תהיינה נתונות ומוגדרות מראש).

המספרים 60 ו-65 מהווים את הגבולות האמיתיים של המחלקה הראשונה (60 הוא הגבול האמיתי התחתון, 65 הוא הגבול האמיתי העליון). המספרים 65 ו-70 מהווים את הגבולות האמיתיים של המחלקה השנייה, וכך הלאה.

ההפרש בין הגבול האמיתי העליון והגבול האמיתי התחתון של המחלקה מכונה רוחב המחלקה.
בדוגמה זו, כל המחלקות הן ברוחב 5 .

כל אחד מנתוני הסדרה שייך למחלקה אחת בלבד !
בהתאם לכך, שלושת האיברים הראשונים של הסדרה שייכים למחלקה הראשונה, ולכן שכיחות המחלקה הזאת היא 3; חמשת האיברים הבאים שייכים למחלקה השנייה, ולכן שכיחות המחלקה היא 5 , וכך הלאה.

אבל יש גם מקרים מיוחדים. למשל הערך 80 שבסדרה: האם הוא שייך למחלקה הרביעית או החמישית?
כדי לפתור בעיות  מסוג  זה, החליטו הסטטיסטיקאים שעבור כל מחלקה הגבול התחתון האמיתי שייך למחלקה, אך הגבול העליון האמיתי אינו שייך למחלקה (הוא שייך למחלקה הבאה, משום שהוא מהווה בו-זמנית גם גבול תחתון אמיתי למחלקה זו).
בהתאם לכלל  זה, הערך 80 של הסדרה שייך למחלקה החמישית.

על-סמך העובדות האלה נבנה את טבלת השכיחויות של נתוני הסדרה:

 

                     

הערה: לטבלה זו צירפנו גם את השכיחות המצטברת, השכיחות היחסית, והשכיחות היחסית המצטברת.
           פרמטרים אלה מוגדרים ומחושבים בדיוק כמו בסעיף הקודם.

 

למעלה

תרגילים
1. בקופסה 45 ברגים. להלן שתי טבלאות הכוללות נתונים על אורך הברגים ומשקלם:

                           

 עבור כל אחת מהטבלאות מצא:
א.  את הגבולות האמיתיים של המחלקה השנייה.
ב.  את הגבולות האמיתיים של המחלקה הרביעית.
ג. הרוחב של כל מחלקה.
ד. השכיחות של המחלקה הראשונה.
ה. השכיחות היחסית של המחלקה הרביעית.
ו. המחלקה ששכיחותה הגבוהה ביותר.
ז. השכיחות המצטברת של המחלקה השלישית.
ח. השכיחות היחסית המצטברת של המחלקה שלפני האחרונה.

 2. מפעל מייצר ומשווק קפה בקופסאות שמשקלו הנומינלי 200 גרם. נציג של ארגון הצרכנים בחר
    באקראי 40 קופסאות, שקל אותן וקיבל את התוצאות הבאות:

170,192,177,197,184,180,180,160,201,194,187,208,204,195,218,200,200,191,173,203
195,225,174,190,185,180,201,221,190,225,226,210,200,229,197,191,205,218,217,200     
         :סדר את הנתונים בטבלת השכיחויות הבאה והשלם את החסר

 

3. במפעל למוצרי חשמל ביתיים מייצרים מכונות כביסה. כושר הייצור של המפעל הוא 120 מכונות   
ביום.השלב האחרון בתהליך הייצור הוא בדיקת האיכות של המוצר. מנהל המפעל ביקש מראש הצוות
לבדיקת האיכות דוח ממוחשב על התפלגות מספר הפגמים שנתגלו במכונות הכביסה, ביום מסוים. האיש התבלבל, ובמקום הדוח המבוקש הגיש למנהל את הטבלה הבאה:  


 
עקב תקלה במדפסת, השכיחות היחסית המתאימה לערך 4 של X לא הודפסה.
   א. השלם את הנתון החסר.
   ב. בנה טבלת שכיחויות חדשה הכוללת גם את השכיחות הרגילה (f) , השכיחות המצטברת (F
) , 
       והשכיחות היחסית המצטברת (P).

 

 למעלה