3.2  מדדי המרכז

3
.2.1
הממוצע האריתמטי
3.2.2 
החציון   
3.2.3 השכיח
3.2.4 יתרונות וחסרונות של מדדי המרכז

3.2.1 הממוצע האריתמטי
בפרק 1 למדנו שנתונים סטטיסטיים משמשים כבסיס לקבלת החלטות.
לעתים קרובות מקבלי ההחלטות אינם יכולים להתחשב בכל נתון בנפרד, ולכן רצוי לתמצת את אופי הנתונים באמצעות מספר מצומצם של מדדים.  

מדד מרכזי של סדרת נתונים סטטיסטיים הוא פרמטר מספרי המשקף את הנטייה הכללית של איברי הסדרה.
מדדי המרכז העיקריים הם: הממוצע האריתמטי, החציון והשכיח. בתת-סעיף זה נעסוק בממוצע האריתמטי בלבד.

הגדרה: הממוצע האריתמטי של סדרת מספרים הוא היחס שבין סכום המספרים ובין מספר המספרים.
דוגמה: בפקולטה להנדסה של אוניברסיטה יוקרתית מתקבלים מדי שנה 80 תלמידים בלבד. המועמדים מתקבלים על-סמך הציון הממוצע של מבחני הבגרות. מתקבלים 80 המועמדים שממוצעי ציוניהם בבחינות הבגרות הם הגבוהים ביותר מקרב כלל המועמדים.

על-סמך נתוני המועמדים ידוע שסף הקבלה השנה הוא 90 . לפניכם ציוני בחינות הבגרות של מועמד פלוני: 92,87,95,88,100,90,90,94 . האם הוא יתקבל ללימודים?

פתרון: על-סמך הגדרת הממוצע האריתמטי:

                                            
 
לכן ממוצע ציוני הבגרות של המועמד יהיה:          
                                           

למעלה

פעילות באקסל:
א. קרא את ההסבר על הפונקציה Average.
ב. פתח גיליון חדש בקובץ האקסל.
ג. הזן בעמודה A את הנתונים הרשומים בדוגמה של הפקולטה להנדסה.
ד. חשב את ממוצע הציונים של המועמד. האם התקבלה אותה תוצאה?

  (לחץ לעבור לאקסל)

בדוגמה נבחרו באמצעות העכבר שתי סדרות מספרים: A1:A3 ו- D6:D8. הפונקציה חישבה את ממוצע כל הערכים בתאים אלו. שינוי באחד התאים ישפיע מיידית ובצורה שוטפת על תוצאת החישוב.

הפונקציה שנוצרת בתוך שורת הנוסחאות היא: =AVERAGE(A1:A3,D6:D8).

הערות:
·        הארגומנטים יכולים להיות מספרים, טווחים או הפניות לתאים המכילים  מספרים.
·        ערכים לוגיים וטקסט המייצג מספרים שיוקלדו ישירות אל תוך רשימת הארגומנטים  ייכללו בספירה.
·        אם ארגומנט של טווח או הפניה לתא מכיל טקסט, ערכים לוגיים או תאים ריקים,  המערכת תתעלם מערכים אלה;
        עם זאת, תאים עם הערך אפס ייכללו.
·        ארגומנטים שהם ערכי שגיאה או טקסט שאינו ניתן לתרגום למספרים גורמים לשגיאות.      

 סרטון שימוש בפונקציית ממוצע (לחץ על התמונה על מנת לצפות בסרטון)

פעילות באקסל:
א. חזור לדוגמה שבגיליון "תעודות הצטיינות".
ב. הוסף את העמודה שתחשב את המכפלה של כל אחד מערכי X בשכיחות שלו.
ג. חשב את ממוצע הנתונים. שים לב שהפעם אינך יכול להשתמש בפונקצית 
       לחישוב הממוצע של מספר תעודות ההצטיינות. מדוע? Average   

  (לחץ לעבור לאקסל)



 

למעלה

3.2.2  החציון  

הממוצע האריתמטי הוא המדד המרכזי הנפוץ ביותר, אך במצבים מסוימים המדד הזה אינו משקף את המציאות בצורה נאמנה.
דוגמה: במחלקה לסטטיסטיקה של חברת ביטוח מעסיקים חמישה סטטיסטיקאים. הנתונים הבאים מתארים את השכר לשעה (בש"ח) של כל אחד מהם: 62,68,75,80,87 (השכר תלוי ברמת ההשכלה ובוותק).

השכר הממוצע של הסטטיסטיקאים הוא 74.4 ש"ח לשעה (בדוק!). מספר זה משקף היטב את הנטייה הכללית של  הנתונים. כעבור שנה, קודם הסטטיסטיקאי הבכיר (ששכרו לשעה היה 87 ש"ח) לתפקיד ראש המחלקה, ושכרו הועלה ל-250 ש"ח לשעה. לכן סדרת נתוני השכר תהיה עכשיו: 62,68,75,80,250 והשכר הממוצע יהיה 107 ש"ח לשעה (בדוק!).

מספר זה אינו משקף בצורה טובה את הנטייה הכללית של הנתונים (אף אחד מהתוכניתנים לא מרוויח לשעה סכום קרוב לזה!), ולכן יש צורך במדד מרכזי אחר, המסוגל לתאר את המציאות החדשה בצורה נאמנה.
המדד המתאים ביותר לתיאור הנטייה הכללית של הנתונים במצב הנוכחי הוא החציון (המסומן ב- Me ,קיצור המונח הלועזי Median).

הגדרה: החציון של סדרת נתונים הוא ערך המשתנה אשר מספר הנתונים הקטנים ממנו (או שווים לו) שווה למספר הנתונים הגדולים ממנו (או שווים לו).

הערה חשובה: לצורך חישוב החציון חובה לסדר את איברי הסדרה בסדר עולה.

כדי לחשב את החציון של סדרת נתונים נבחין בין שני מקרים: N אי-זוגי, ו-N זוגי (N מסמן את מספר איברי הסדרה).

א.  N אי-זוגי
במקרה זה, החציון הוא האיבר האמצעי של הסדרה. בדוגמה הנ"ל למשל 75= Me (בשני המקרים!) כי שניים מאיברי הסדרה, הנמצאים לפניו, קטנים ממנו, והשניים הנמצאים אחריו גדולים ממנו.

הנוסחה הכללית לחישוב החציון של סדרת נתונים שבה מספר האיברים אי-זוגי היא:

                                                          

ב. N זוגי
נמחיש גם הפעם את אופן החישוב של החציון באמצעות דוגמה: קבוצה של שישה תלמידים השיגו את  הציונים הבאים במבחן באנגלית: 58,63,67,74,82,90. מאחר שמספר איברי הסדרה הוא זוגי, אי-אפשר למצוא איבר אחד בסדרה שמספר האיברים הנמצאים לפניו יהיה שווה למספר האיברים שאחריו.
לעומת זאת, אפשר להצביע על שני איברים שביחד נהנים מהתכונה הזאת: 67 ו-74.
ואומנם, יש שני איברים בסדרה שהם קטנים מ-67 ושני איברים גדולים מ-74 .

לכן, כשמספר איברי הסדרה הוא זוגי, החציון מוגדר כממוצע של שני האיברים המרכזיים:

                                                                   

הנוסחה הכללית לחישוב החציון של סדרת נתונים שבה מספר האיברים זוגי היא אפוא:

                                           

למעלה

פעילות באקסל:
א. קרא את ההסבר על הפונקציה Median.
ב. עבור לגיליון "הפקולטה להנדסה".
ג. חשב את חציון הציונים של המועמד.

        

 (לחץ לעבור לאקסל)


בדוגמה כאן, נבחרה באמצעות העכבר סדרת מספרים B2:B21 . הפונקציה החזירה את הערך המצוי באמצע קבוצת נתונים זו. שינוי באחד התאים יכול להשפיע מיידית על תוצאת החישוב. הפונקציה שנוצרת בתוך שורת הנוסחאות היא: =MEDIAN (B2:B21).

הערות

·        אם יש מספר זוגי של מספרים בקבוצה, תחשב הפונקציה MEDIAN את ממוצע שני המספרים האמצעיים. ·        הארגומנטים יכולים להיות מספרים, טווחים או הפניות לתאים המכילים מספרים.       
·        ערכים לוגיים וטקסט המייצג מספרים המוקלדים ישירות אל תוך רשימת הארגומנטים ייכללו בספירה.                
·        אם ארגומנט מערך או ארגומנט הפניה מכיל טקסט, ערכים לוגיים או תאים ריקים, המערכת תתעלם מערכים אלה;
        עם זאת, תאים עם הערך אפס ייכללו.    
·        ארגומנטים שהם ערכי שגיאה או טקסט שאינו ניתן לתרגום למספרים גורמים לשגיאות.

השיטה שהצגנו כאן למציאת החציון תקפה גם כאשר המשתנה הוא בדיד והנתונים מסודרים בטבלת שכיחויות.

דוגמה: מצא את החציון של ההתפלגות:

                                                  

 

הערה: עמודת השכיחויות המצטברת (F) אינה הכרחית, אך הדבר מועיל לפתרון הבעיה)


 

פעילות באקסל:
א. חזרו לדוגמא המופיעה בגיליון "תעודות הצטיינות"
ב. שימו לב שאין באפשרותכם להשתמש בפונקציית Median לחישוב החציון. מדוע?

 (לחץ לעבור לאקסל)

למעלה

3.2.3  השכיח  
 


   (לחץ לעבור לאקסל)

  (לחץ לעבור לאקסל)

קל למצוא את השכיח גם כאשר הנתונים בדידים ומסודרים בטבלת שכיחויות.
דוגמה: מצא את השכיח של ההתפלגות:

                                                   
השכיח  הוא  Mo = 7 , כי לערך זה של   X  יש שכיחות מרבית.

 פעילות באקסל:
א. חזור לדוגמה שבגיליון "תעודות הצטיינות".
ג. שים לב שאינך יכול להשתמש בפונקצית Mode לחישוב השכיח. מדוע?

 (לחץ לעבור לאקסל)

למעלה

 3.2.4 יתרונות וחסרונות של מדדי המרכז

להלן רשימת היתרונות והחסרונות של שלושת מדדי המרכז. הם יעזרו להחליט באיזה מדד מרכזי כדאי להשתמש בכל מצב נתון.  א.  הממוצע האריתמטי
         יתרונות :  * קל לחישוב. 
                           * ניתן לחשב אותו תמיד. 
                           * חישוב הממוצע מבוסס על כל הנתונים. 
                           * מועיל גם למטרות אחרות (כגון חישוב סטיית התקן). 
 ב. החציון  
          יתרונות :  * קל לחישוב.  
                            * ניתן לחשב אותו תמיד.
                            * אינו מושפע מערכים קיצוניים של המשתנה.

         חסרונות:   * אינו מבוסס על כל הנתונים. 
                            * אינו שימושי למטרות אחרות.   

  ג. השכיח
          יתרונות :  *  קל לחישוב.
                            *  אינו מושפע מערכים קיצוניים של המשתנה.

         חסרונות :  *  לא תמיד אפשר לחשב אותו.   
                            *  לא תמיד מצביע על הנטייה הכללית של הנתונים (למשל כאשר יש שני שכיחים).
                            *  אינו שימושי למטרות אחרות.

למעלה

תרגילים

למעלה