3.4  הצגה גרפית של נתונים סטטיסטיים

3.4.1  דיאגרמת עוגה (פאי)
3.4.2 
דיאגרמת מקלות
3.4.3  היסטוגרם 
3.4.4  מצולע השכיחויות
 
3.4.5  עקומת השכיחויות (או עקומת ההתפלגות)
 
3.4.6  תרשימים באקסל

3.4.1  דיאגראמת עוגה (פאי)

בפרק 1 למדנו שמטרה נוספת של הסטטיסטיקה התיאורית היא תיאור גרפי של הנתונים. בסעיף זה נכיר את דיאגראמת העוגה (המכונה גם דיאגראמת פאי), שהיא אמצעי פשוט ונוח לתיאור נתונים איכותיים.

דוגמה: ביישוב קטן יש 2,000 בעלי זכות בחירה. בבחירות למועצה המקומית הצביעו 1,000 אזרחים בעד מפלגת האדומים, 400 בעד מפלגת הכתומים, 300 בעד מפלגת הירוקים, ו-300 נמנעו מלהצביע.

תאר את הנתונים באמצעות דיאגראמת עוגה.

פתרון: נרכז את הנתונים בטבלת שכיחויות, ונחשב את השכיחות היחסית של כל ערך:

 

למעלה

3.4.2 דיאגראמת מקלות

דיאגראמת מקלות היא אמצעי גרפי לתיאור התפלגות של משתנה כמותי בדיד. נמחיש את הדבר באמצעות  דוגמה.

דוגמה: בתחרויות אתלטיקה השתתפו 105 ספורטאים. הטבלה הבאה מסכמת את התפלגות תעודות ההצטיינות בקרב הספורטאים:        

תאר את התפלגות  הנתונים באמצעות דיאגרמת מקלות.
פתרון: כדי לבנות דיאגרמת מקלות, תחילה יש לסרטט מערכת של שני צירים מאונכים זה לזה.
הציר האופקי (ציר ה-X ) מתאר את הערכים של המשתנה הבדיד X. הציר האנכי (ציר ה-f) מתאר את השכיחות של הערכים של X.

הערה: בניגוד למערכת הצירים המקובלת במתמטיקה, כאן אין צורך שראשית הציר האופקי תתלכד בראשית הציר האנכי.

על-פי טבלת הנתונים, השכיחות של הערך  X=0 היא 10, ולכן אורך ה"מקל" המתאים הוא 10 יחידות; השכיחות של הערך X=1 היא 15, ולכן אורך ה"מקל" המתאים הוא 15 יחידות, וכך הלאה.

למעלה

 3.4.3  היסטוגרם

ההיסטוגרם הוא אמצעי גרפי לתיאור התפלגות של משתנה כמותי רציף. קיים הבדל משמעותי בין דיאגרמת מקלות והיסטוגרם: בדיאגרמת מקלות השכיחות של ערך מסוים של המשתנה מתוארת על-ידי אורך  ה"מקל", ואילו בהיסטוגרם השכיחות של מחלקה מתוארת באמצעות שטח של מלבן.

מספר המלבנים בהיסטוגרם שווה למספר המחלקות שבטבלת השכיחויות. הבסיס של כל מלבן שווה לרוחב המחלקה המתאימה; גובה המלבן שווה לצפיפות המחלקה (נזכיר שהצפיפות של המחלקה מוגדרת כיחס בין שכיחות המחלקה ורוחב המחלקה).

דוגמה: טבלת השכיחויות הבאה מתארת את השכר לשעת עבודה בקרב 100 עובדים של מפעל מסוים:

    

תאר את הנתונים באמצעות היסטוגרם.
פתרון: כדי לבנות את ההיסטוגרם, נצרף לטבלת השכיחויות את עמודת הצפיפות (המסומנת ב-f ' ).

                                       

בדומה לדיאגרמת מקלות, גם ההיסטוגרם מתואר באמצעות מערכת של שני צירים מאונכים זה לזה,
אך הציר האופקי (ציר ה-X ) מתאר את המחלקות של ההתפלגות, והציר האנכי מתאר את הצפיפות של המחלקה (לכן יסומן ב-f ' ).

נציין שגם הפעם אין צורך שראשית הציר האופקי תתלכד בראשית הציר האנכי.להלן ההיסטוגרם המתאר את ההתפלגות:       

למעלה

3.4.4  מצולע השכיחויות

אם נתבונן פעם נוספת בהיסטוגרם הזה, מתקבל הרושם שהפיזור של שכיחות הנתונים בתוך כל מחלקה הוא אחיד, ולכן גובה המלבנים משתנה ב"קפיצות". על-פי-רוב הדבר אינו נכון, ומצולע השכיחויות מתקן את הרושם הזה.

מצולע השכיחויות המתאים להיסטוגרם הזה מתקבל באופן הבא:

א.  סמן את הנקודה האמצעית של הבסיס העליון של כל אחד ממלבני ההיסטוגרם. כך תקבל
     את 
הנקודות  E,D,C,B,A  בציור שלהלן.
ב.  סמן את הנקודות F ו-G שעל הציר האופקי של ההיסטוגרם (כך שהקטע FH  יהיה שווה  
    
למחצית הבסיס של המלבן הראשון, והקטע GK יהיה שווה למחצית הבסיס של המלבן
    האחרון).
ג.  חבר בקטע ישר כל זוג של נקודות עוקבות  שקיבלת בדרך זו. כך מתקבל מצולע השכיחויות:
    FABCDEG.         

למעלה

3.4.5 עקומת השכיחויות (או עקומת ההתפלגות)

נניח שבמחקר סטטיסטי על התפלגות המשכורות  החודשיות במגזר הציבורי הצטברו הרבה מאוד נתונים, ולכן אפשר לבנות טבלת שכיחויות בעלת מספר גדול מאוד של מחלקות "צרות" (כלומר, בעלות רוחב קטן).

אם נבנה היסטוגרם ומצולע שכיחויות עבור ההתפלגות הזאת, הרי שהמצולע יהיה מורכב ממספר רב של צלעות קצרות. במקרה זה אפשר "להחליק" את המצולע, כלומר להפוך אותו לעקומה "חלקה", המכונה עקומת השכיחויות (או עקומת ההתפלגות).

להלן דוגמא של עקומה כזו:

 

לעתים קרובות נהוג לסמן בציור העקומות האלה גם את המיקום של מדדי המרכז של ההתפלגות.
ראוי לציין כי:
   א.  המיקום של השכיח (Mo) הוא נקודה על ציר ה-X, התואמת את הנקודה הגבוהה ביותר 
       של
העקומה.
   ב.  המיקום של החציון (Me) הוא נקודה על הציר האופקי (ציר ה-X), כך שהאנך העולה ממנו
        מחלק 
את השטח הכלוא בין העקומה וציר ה-X לשני חלקים שווים בשטחם.

להלן עקומות ההתפלגות הנפוצות ביותר: 

   (1)  עקומת ההתפלגות הנורמאלית


זאת עקומה שמתארת התפלגות סימטרית חד-שיאית, שבה שלושת המדדים המרכזיים שווים זה לזה. לכן הם מתלכדים לנקודה אחת על הציר האופקי.

למעלה

(2) עקומת ההתפלגות U

          

גם העקומה הזאת מתארת התפלגות סימטרית, אך הפעם היא דו-שיאית, כלומר יש לה שני שכיחים. לעומת זאת, הממוצע והחציון שווים זה לזה, ונמצאים במרכז ההתפלגות.

(3)  עקומת ההתפלגות האחידה


עקומה זו (שהיא בעצם קטע ישר, מקביל לציר האופקי) מתארת התפלגות שצפיפותה אחידה. להתפלגות זו אין שכיח. לעומת זאת, הממוצע והחציון שווים זה לזה, ומתלכדים לנקודה אחת על הציר האופקי, במרכז ההתפלגות.

למעלה

(4)  עקומת ההתפלגות האסימטרית ימנית (חיובית)

 

 

(6) עקומת ההתפלגות הבי-מודלית

עקומה זו מתארת התפלגות בעלת שני שיאים (על פי רוב בעלי גובה שונה).
הערה: יש גם התפלגויות בעלות מספר גדול יותר של שיאים.

למעלה

הפונקציה Skew

 (לחץ לעבור לאקסל)

3.4.5.6   מצולע השכיחויות המצטברות

מצולע השכיחויות המצטברות הוא עוד אמצעי לתיאור גרפי של נתונים סטטיסטיים המשקפים התפלגות של משתנה כמותי רציף. נמחיש את הדבר באמצעות דוגמה.

   דוגמה: להלן התפלגות השכר החודשי של 80 עובדים:


 המצולע מתחיל מנקודה (0 ; 4,000), המתאימה למשכורת הנמוכה ביותר ושכיחות מצטברת אפס. נקודה נוספת של המצולע היא (5 ; 5,000), המתאימה לגבול האמיתי העליון של המחלקה הראשונה והשכיחות המצטברת המתאימה. נקודה נוספת של המצולע היא (15 ; 6,000), המתאימה לגבול האמיתי העליון של  המחלקה השנייה והשכיחות המצטברת המתאימה וכך הלאה.

בהמשך, מחברים כל זוג של נקודות עוקבות בקטע ישר, וכך מקבלים את מצולע השכיחויות המצטברות.

למעלה

3.4.6 תרשימים באקסל

התרשים הוא הצגה גראפית של נתוני הגיליון - כולם או חלקם. במקרים רבים התרשימים הופכים את טבלאות הנתונים למידע חזותי, הברור יותר להבנה. מיקום התרשים יכול להיות בגיליון עצמו או מחוצה לו. התרשים מתעדכן בכל פעם שמשתנים נתוני הגיליון שמהם הוא מורכב.

 (לחץ לעבור לאקסל)

הוספת תרשים חדש

שלב 2 מתוך 4:
בשלב זה מגדירים או מעדכנים את טווח הנתונים אותם רוצים להציג גרפית. קיימת אפשרות להתוות סידרת נתונים אחת או יותר בתרשים אחד (לתרשימי עוגה, למשל, יש סדרה אחת בלבד). לכל סידרת נתונים בתרשים יש צבע או תבנית והיא מיוצגת במקרא התרשים.

קיימות שתי לשוניות בחלון זה "טווח נתונים" ו-"סדרה":

     
 (לחץ לעבור לאקסל)

למעלה

שלב 3 מתוך 4:
בשלב זה מוגדרות אפשרויות התרשים השונות כמו כותרות צירים, תוויות נתונים ועוד. בעת שינוי ההגדרות ניתן לצפות בתצוגה מקדימה של התרשים על מנת לוודא שמתקבל המראה שרצוי לנו.
חלון זו מכיל בתוכו שש לשוניות:

          1.   בלשונית כותרות  ניתן להגדיר כותרת לתרשים כולו ולצירים:

 (לחץ לעבור לאקסל)


 (לחץ לעבור לאקסל)

 (לחץ לעבור לאקסל)

למעלה

 (לחץ לעבור לאקסל)

סרטון הוספת תרשים חדש (לחץ על התמונה על מנת לצפות בסרטון)

 

 

עריכת התרשים ועיצובו

 

 (לחץ לעבור לאקסל)

הוספת כותרת לתרשים ולצירים
כדי להוסיף כותרת לתרשים או לצירי X ו-Y יש ללחוץ על "אפשרויות תרשים" בתפריט המופיע למעלה.
נפתח חלון 'אפשרויות תרשים  - שלב 3 מתוך 4'. בלשונית כותרות ניתן להקליד את הכותרות הרצויות. 

סרטון הוספת כותרת לתרשים (לחץ על התמונה על מנת לצפות בסרטון)


 הוספת תווית נתונים
כדי לזהות במהירות סדרת נתונים בתרשים, אפשר להוסיף תוויות נתונים לנקודות הנתונים של התרשים. כברירת מחדל, תוויות הנתונים מקושרות לערכים בגיליון העבודה, והן מתעדכנות באופן אוטומטי כאשר נעשים שינויים בערכים אלה.
יש ללחוץ על "אפשרויות תרשים" בתפריט המופיע למעלה, לבחור בלשונית "תוויות נתונים", ולבחור את האפשרות הרצויה.

סרטון הוספת תויות לתרשים (לחץ על התמונה על מנת לצפות בסרטון)

עיצוב התרשים


 (לחץ לעבור לאקסל)

למעלה

סרטון עיצוב תרשים (לחץ על התמונה על מנת לצפות בסרטון)

עיצוב אזור הצירים X ו-Y
בעיצוב איזור ציר ה-Y ניתן להכנס ללשונית 'סרגל' שם ניתן  לשנות את צורת הצגת הערכים בציר Y. בין השאר ניתן גם לשנות את גודל המרווחים בין הערכים המופיעים על הציר ואת הערך המזערי והמרבי.

 

 (לחץ לעבור לאקסל)

סרטון שינוי אופן הצגת ערכי הצירים (לחץ על התמונה על מנת לצפות בסרטון)

עיצוב כיוון התרשים – שינוי מיקום ציר Y

 

סרטון שינוי מיקום ציר - Y  (לחץ על התמונה על מנת לצפות בסרטון)

 (לחץ לעבור לאקסל)

פתרון תרשים עוגה.xls

פתרון תרשים טורים.xls

למעלה

תרגילים


 


למעלה