6.1  קשר דטרמיניסטי וקשר סטטיסטי בין שני משתנים

6.1.1  קשר ליניארי בין משתנים

רצונו של האדם לחזות את העתיד הוא שאיפה עתיקת-יומין. כל אדם היה רוצה לקבל תשובות מדויקות לשאלות כגון:

         * מה יהיו התוצאות במשחקי הכדורגל בשבת הקרובה? (במיוחד אם האיש נוהג למלא טופס
           טוטו)

         * כיצד תתנהג מניה מסוימת שנסחרת בבורסה במשך החודשיים הקרובים? (בהנחה שהאדם
            השקיע כסף ברכישת המניה)

         *  מה יהיה מזג האוויר בצפון איטליה במחצית השנייה של חודש ספטמבר? (האיש מתכנן   
            לבלות שם את חופשתו בתקופה זו)

 קשה מאוד לתת תשובה מדויקת לשאלות אלה, אך במקרים מסוימים החיזוי אפשרי בהחלט, ולהלן דוגמה שממחישה זאת.

דוגמה: רכבת יוצאת מבאר-שבע לכיוון חיפה במהירות קבועה של 80 קמ"ש. איזה מרחק תעבור הרכבת כעבור שעה, כעבור שעה וחצי, וכעבור שעתיים?

פתרון: במקרה זה  החיזוי מבוסס על הנוסחה הידועה: vt  S =, כלומר בתנועה שוות-מהירות המרחק Sשווה למכפלת המהירות v בזמן t . במילים אחרות, קיים קשר חד-משמעי בין המשתנים t ו- S (בהנחה ש- v  נשאר קבוע).
 

אך הנוסחה הזאת מאפשרת לפתור גם את הבעיה ההפוכה, כלומר לחזות את
t על-סמך S.
דוגמה: רכבת יוצאת מבאר-שבע לכיוון חיפה, במהירות קבועה של 80 קמ"ש. כעבור כמה זמן תימצא הרכבת במרחק של 140 ק"מ מבאר-שבע?


גם במסגרת הסטטיסטיקה אפשר לחקור קשר בין משתנים, אך הפעם מדובר בקשר סטטיסטי. משמעות הדבר שקיים קשר מסוים בין שני משתנים, אך הקשר אינו חד-משמעי ולכן אי-אפשר לחזות באופן מדויק את אחד המשתנים על-סמך המשתנה האחר.

להלן מספר דוגמאות של קשר סטטיסטי בין שני משתנים:
         א.         הקשר בין ההכנסה של משפחה ובין צריכת החשמל של המשפחה.
         ב.         הקשר בין הציון במתמטיקה ובין הציון בפיזיקה של תלמיד.
          ג.         הקשר בין הגובה של אדם ובין משקלו.
         ד.         הקשר בין מספר שנות הלימוד של אדם ובין שכרו.
         ה.         הקשר בין זמן ההמתנה בתור בסניף של בנק ובין מספר הכספרים באותו סניף.

למעלה

 6.1.1  קשר ליניארי בין משתנים

הקשר הפשוט ביותר בין שני משתנים x ו- y הוא הקשר הליניארי. הצורה המתמטית של הקשר הזה היא:
 b+y = ax  כאשר a ו- b קבועים. בהמשך נציג נוסחאות לחישוב המקדמים a ו- b, אך לפני כן עלינו
לבדוק האם אכן יש קשר ליניארי בין המשתנים x ו- y.

כדי להבין יותר טוב במה הדברים אמורים, נציג דוגמה:
דוגמה: רופא (שמתמחה ברפואת ילדים) רצה לחקור את הקשר בין גיל התינוקות ובין משקלם. לשם כך הוא שקל 10 תינוקות שנבחרו באקראי, בגילים שונים,  וקיבל את התוצאות הבאות:

 

על-פי דיאגרמת הפיזור הזאת, אכן יש קשר בין גיל התינוקות ובין משקלם (עקרונית, ככל שגיל התינוק מתקדם יותר, הוא שוקל יותר), אך בוודאי שאין קשר ליניארי מושלם בין המשתנים (אחרת הנקודות בדיאגרמת הפיזור היו "יושבות" על קו ישר).

מתעורר אפוא הצורך למדד סטטיסטי לקביעת עוצמת הקשר הליניארי בין שני משתנים. המדד הזה מכונה "מקדם המתאם הליניארי", הוא מסומן ב-
r, ומחושב באמצעות הנוסחה:

 


למעלה

דיאגרמות הפיזור שבתרשים הבא ממחישות את הערכים השונים של מקדם המתאם  r.

נשתמש בנוסחה (6.1.1) כדי לחשב את מקדם המתאם בין המשתנים X ו-Y שבדוגמה הקודמת.

 

למעלה