Zur Analyse dieses Modells in R verwenden wir den Befehl
Zur Analyse dieses Modells in`R`verwenden wir den Befehl
```{r results = 'hide'}
attach(USairpollution)
...
...
@@ -672,10 +672,12 @@ da $Z_i\sim N(0,\sigma^2)$ für $i=p+1,\ldots, n$. Weiter sind die Zufallsvariab
<br>
Im Fall normalverteilter Fehler ist der Kleinste-Quadrate-Schätzer zugleich der Maximum-Likelihood-Schätzer für den Parameter $\beta$, was uns eine tiefere Rechtfertigung für die Verwendung des Kleinste-Quadrate-Schätzers liefert, die bereits Gauß bekannt war. Um dies zu erkennen, schreiben wir zunächst die gemeinsame Dichte der Beobachtungen $Y_1, \ldots, Y_n$ auf.
Nach den Transformationsregeln für eindimensionale Normalverteilungen hat $Y_i = \sum^{p}_{j=1}x_{ij} \beta_j + \epsilon_i$ eine $N(\sum^p_{j=1}x_{ij} \beta_{j}, \sigma^2)$-Verteilung und somit haben $Y_1,\ldots,Y_n$ die gemeinsame Dichtefunktion
und somit ist der Maximum-Likelihood-Schätzer gegeben durch $\hat{\sigma}_{ML}^2= \frac{1}{n}\, ||y-X \hat{\beta}||^2$. Wir weisen darauf hin, dass der Maximum-Likelihood-Schätzer von dem eingangs eingeführten Schätzer $s^2$ insofern abweicht, als wir durch $n$ teilen und nicht durch $n-p$. Entsprechend ist der Maximum-Likelihood-Schätzer auch nicht erwartungstreu.
:::
## Konfidenzintervalle für die Regressionsparameter
Wir können die bislang erzielten Ergebnisse jetzt verwenden, um Konfidenzintervalle für die Parameter des linearen Modells anzugeben. Vorab formulieren und beweisen wir eine Folgerung aus dem obigen Satz.
::: {#thm-regression3-cor}
...
...
@@ -775,7 +779,9 @@ Schließlich können wir noch Konfidenzintervalle für die Parameter $\alpha$ un
Die oben gemachte Bemerkung über die Varianz von $\hat{\beta}$ spiegelt sich hier in der Länge des Konfidenzintervalls wider, das umgekehrt proportional zu $\sqrt{\sum_{i=1}^n (x_i-\bar{x})^2}$ ist.
:::
## Konfidenzintervalle für die Regressionsparameter
::: {.remark}
### Konfidenzintervalle für die Regressionsparameter in R
<br>
Ein $(1-\alpha)$-Konfidenzintervall für den Regressionsparameter
$\beta_j$ ist gegeben durch
...
...
@@ -788,6 +794,7 @@ geschätzte Standardabweichung findet man in `R` in der Spalte
neben dem Schätzwert für den Parameter $\beta_j$. So erhalten wir etwa
für den Parameter $\beta_2$ das $95\%$-Konfidenzintervall mit den
Grenzen $0.065 \pm 0.032$, also das Intervall $[0.033, 0.097]$.