Der kritische Wert für den einseitigen T-Test zum Signifikanzniveau $\alpha_{0}=0.05$ ist in diesem Fall $t_{11;0.05}=-1.80$. Da der beobachtete Wert der Teststatistik kleiner als der kritische Wert ist, verwerfen wir die Nullhypothese $H_0: \beta=0$ zu Gunsten der Alternativhypothese $H_1:\beta<0$. Wir können also davon ausgehen, dass die morgendliche Außentemperatur einen negativen Einfluss auf den Energieverbrauch der Heizung hat.
Der kritische Wert für den einseitigen T-Test zum Signifikanzniveau $\alpha_{0}=0.05$ ist in diesem Fall $t_{11,0.05}=-1.80$. Da der beobachtete Wert der Teststatistik kleiner als der kritische Wert ist, verwerfen wir die Nullhypothese $H_0: \beta=0$ zu Gunsten der Alternativhypothese $H_1:\beta<0$. Wir können also davon ausgehen, dass die morgendliche Außentemperatur einen negativen Einfluss auf den Energieverbrauch der Heizung hat.
Ergänzend berechnen wir noch den $p$-Wert, der in diesem Fall gegeben ist durch
$$
...
...
@@ -178,12 +178,12 @@ ersetzen, so verändert dies die Verteilung in eine
$t_{n-2}$-Verteilung und somit gilt mit Wahrscheinlichkeit $1-\alpha_{0}$,
und somit bildet $\Big[\hat{\beta}_j - t_{n-p; 1-\alpha/2}\, \sqrt{s^2\, ((X^t X)^{-1})_{jj}}\, ,\, \hat{\beta}_j + t_{n-p; 1-\alpha/2}\, \sqrt{s^2\, ((X^t X)^{-1})_{jj}}\Big]$ ein $(1-\alpha)$-Konfidenzintervall für den Parameter $\beta_j$.
und somit bildet $\Big[\hat{\beta}_j - t_{n-p, 1-\alpha/2}\, \sqrt{s^2\, ((X^t X)^{-1})_{jj}}\, ,\, \hat{\beta}_j + t_{n-p, 1-\alpha/2}\, \sqrt{s^2\, ((X^t X)^{-1})_{jj}}\Big]$ ein $(1-\alpha)$-Konfidenzintervall für den Parameter $\beta_j$.
:::
...
...
@@ -714,10 +714,10 @@ Wenn möglich, sollte man also Experimente bei weit auseinanderliegenden $x$-Wer
Schließlich können wir noch Konfidenzintervalle für die Parameter $\alpha$ und $\beta$ der Regressionsgerade angeben. Wir erhalten die $(1-\alpha)$-Konfidenzintervalle
\begin{align*}
\Big[\hat{\alpha}- s \, \sqrt{\frac{\sum^n_{i=1}x_i^2}{n \sum^n_{i=1}(x_i - \bar{x})^2}} \cdot t_{n-2; 1-\alpha/2}
Die oben gemachte Bemerkung über die Varianz von $\hat{\beta}$ spiegelt sich hier in der Länge des Konfidenzintervalls wider, das umgekehrt proportional zu $\sqrt{\sum_{i=1}^n (x_i-\bar{x})^2}$ ist.
:::
...
...
@@ -727,7 +727,7 @@ Die oben gemachte Bemerkung über die Varianz von $\hat{\beta}$ spiegelt sich hi
Ein $(1-\alpha)$-Konfidenzintervall für den Regressionsparameter
2. Ein $95\%$-Konfidenzintervall für $\beta_2$ finden wir gemäß der Formel „Schätzwert $\pm\, t_{n-p;0.975}\cdot$ Geschätzte Standardabweichung des Schätzers”. Es gilt hier $n=41, p=3$ und
$t_{38;0.975}=2.02$, sodass das $95\%$ Konfidenzintervall gegeben ist durch
2. Ein $95\%$-Konfidenzintervall für $\beta_2$ finden wir gemäß der Formel „Schätzwert $\pm\, t_{n-p,0.975}\cdot$ Geschätzte Standardabweichung des Schätzers”. Es gilt hier $n=41, p=3$ und
$t_{38,0.975}=2.02$, sodass das $95\%$ Konfidenzintervall gegeben ist durch
Falls die Hypothese gilt, hat $F$ eine $F_{p-q,p}$-Verteilung und entsprechend verwirft der $F$-Test zum Niveau $\alpha$, wenn $F\geq F_{p-q,p; 1-\alpha}$.
Falls die Hypothese gilt, hat $F$ eine $F_{p-q,p}$-Verteilung und entsprechend verwirft der $F$-Test zum Niveau $\alpha$, wenn $F\geq F_{p-q,p, 1-\alpha}$.
::: {#exm-regression4-luftverschmutzung-f-test}
In R findet man den Datensatz `USairpollution`, der Daten zur Luftverschmutzung in 41 Großstädten in den USA enthält. Die Luftverschmutzung wir charakterisiert durch den Gehalt an Schwefeldioxid (`SO2`, $y$). Als erklärende Variablen werden die durchschnittliche Jahrestemperatur (`temp`, $x_1$), die Anzahl der Industrieunternehmen mit mindestens $20$ Beschäftigten (manu, $x_2$), die Einwohnerzahl (`popul`, $x_3$), die durchschnittliche jährliche Windgeschwindigkeit (`wind`, $x_4$), die jährliche Niederschlagsmenge (`precip`, $x_5$) sowie die durchschnittliche Anzahl an Regentagen (`predays`, $x_6$) verwendet.