Regression
Lineare Regression: Der vermutete Zusammenhang ist linear und folgt der Funktionsgleichung y=kx+d.
Streudiagramm: In einem Koordinatensystem eingezeichnete Wertepaare der erfassten Daten. (Punktwolke, scatter plot)
Regressionsgerade: Jene Gerade, die sich am besten den vorliegenden Punkten des Streudiagramms anpasst.
Wie bei der Varianz verwendet man die mittleren quadratischen Abweichungen um die Regressionsgerade zu berechnen. (Methode der kleinsten Quadrate)
Es ergeben sich zwei verschiedene Regressionsgeraden, je nach dem, ob man die Abweichungen der x-Koordinate oder der y-Koordinate verwendet. Standardmäßig wird der Vertikalabstand verwendet (Differenz der y-Koordinaten). Der Mathematische Hintergrund ist in der 4. Klasse HAK (Differenzieren, Minimumaufgaben)) zugänglich.
Zur Berechnung der Regressionsgeraden ist das folgende System zu lösen:
Der Rechenvorgang ist in den Statistikprogrammen standardmäßig vorprogrammiert.
(Trendlinie in Excel)
Die Stärke des Zusammenhanges wird durch das Bestimmtheitsmaß (bzw. den Korrelationskoeffizienten) angegeben.
Anmerkungen:
-
Je mehr
das Bestimmtheitsmaß, bzw. der Korrelationskoeffizient gegen Null tendiert,
desto geringer der Zusammenhang.
-
Nur
bei einer ausreichend großen Anzahl von Daten ist r, bzw. B aussagekräftig.
- r gibt zusätzlich Auskunft über die Richtung (steigend/fallend) der Gerade