Fürx, y, S
, S
und S
xx
yy
Prognosefehler
Die Regressionskurve von Y auf x ist durch Y = Α + Β⋅x + ε definiert. Bei einer
Menge von n Datenpunkten (x
= unabhängige normalverteilte Zufallsvariablen mit dem Mittelwert (Α + Β⋅x
und der gemeinsamen Varianz σ
Zufallsvariablen mit dem Mittelwert Null und der gemeinsamen Varianz σ
Es sei y
= tatsächlicher Datenwert und
i
kleinsten Quadrate. Der Prognosefehler lautet dann: e
Ein Schätzwert von σ
2
ist der so genannte Standardfehler der Schätzung
1
n
2
s
[
y
(
a
e
i
n
2
i
=
1
Konfidenzintervalle und Hypothesentest bei linearer Regression
Im Folgenden sind einige Konzepte und Gleichungen für statistische
Schlussfolgerungen bei linearer Regression aufgeführt:
•
Vertrauensgrenzen für Regressionskoeffizienten:
Für die Steigung (Β): b − (t
Für den Abschnitt (Α):
a − (t
⋅[(1/n)+x
)⋅s
α
n-2,
/2
e
wobei t der Studentschen t-Verteilung mit dem Freiheitsgrad ν = n – 2
entspricht und n die Anzahl der Datenpunkte in der Stichprobe darstellt.
•
Hypothesentest für die Steigung Β:
lautet die Lösung der Normalgleichungen
xy
S
xy
a
=
y
−
x b
b
=
,
S
xx
= Α + Β⋅x
, y
) gilt Y
i
i
i
2
sowie ε
= unabhängige normalverteilte
i
^
y
= a + b⋅x
i
S
(
S
)
yy
xy
2
bx
)]
i
n
2
< Β < b + (t
)⋅s
/√S
α
n-2,
/2
e
xx
2
1/2
< Α <
/S
]
xx
a + (t
s
xy
=
2
s
x
+ ε
, (i = 1,2,...,n), mit Y
i
I
= Datenprognose der
i
^
= y
-
y
= y
- (a + b⋅x
i
i
i
i
2
/
S
n
1
xx
2
s
1 (
y
n
2
)⋅s
/√S
,
α
n-2,
/2
e
xx
⋅[(1/n)+x
2
)⋅s
/S
]
α
n-2,
/2
e
xx
Seite 18-58
i
)
i
2
.
).
i
2
r
)
xy
1/2
,