---
fontsize: 8pt
format:
  beamer:
    include-in-header: ../ALM_Header.tex
bibliography: ../ALM_Referenzen.bib
---


# {.plain}
<!-- Vorlesungstitel -->
\center
```{r, echo = F, out.width = "20%"}
knitr::include_graphics("../OvGU_Logo.png")
```

\vspace{2mm}
\huge
Allgemeines Lineares Modell

\vspace{6mm}
\large
BSc Psychologie, SoSe 2026

\vspace{5mm}
Joram Soch


<!-- Sitzung 9: Einstichproben-T-Tests -->
# {.plain}

\vfill
\center
\huge
\textcolor{black}{(9) Einstichproben-T-Tests}
\vfill


<!-- Überblick: Kursplan -->
# Überblick

\textcolor{darkblue}{Modul B2: Inferenzstatistik | Allgemeines Lineares Modell}

\small
\center
\footnotesize
\renewcommand{\arraystretch}{1.2}
\begin{tabular}{llll}
Datum        & Einheit                    & Do, 11-15 (ca. 11:15-14:00)         &                              \\ \hline
09.04.2026   & Grundlagen                 & (0) Formalia                        & (1) Regression               \\
16.04.2026   & Grundlagen                 & (2) Korrelation               	    &                              \\
23.04.2026   & Grundlagen                 & (3) Matrizen                        &                              \\
30.04.2026   & Grundlagen / Theorie       & (4) Normalverteilungen              & (5) Modellformulierung       \\
07.05.2026   & Theorie                    & (6) Parameterschätzung              &                              \\
14.05.2026   & -- Feiertag --             &  -- keine Vorlesung --              &                              \\
21.05.2026   & Theorie                    & (7) T-Statistiken                   &                              \\
28.05.2026   & Theorie                    & (8) F-Statistiken                   &                              \\
\textcolor{darkblue}{04.06.2026} & Anwendung & (9) Einstichproben-T-Tests       & (10) Zweistichproben-T-Tests \\
11.06.2026   & Anwendung                  & (11) Einfaktorielle Varianzanalyse  &                              \\
18.06.2026   & Anwendung                  & (12) Zweifaktorielle Varianzanalyse & -- Vorlesung online --       \\
25.06.2026   & Anwendung                  & (13) Partielle Korrelation          &                              \\
02.07.2026   & Anwendung                  & (14) Multiple Regression            &                              \\
09.07.2026   & Anwendung                  & (15) Kovarianzanalyse               &                              \\ \hline
17.07.2026   & Klausurtermin              &                                     &                              \\
Februar 2027 & Klausurwiederholungstermin &                                     &                              \\
\end{tabular}


<!-- Überblick: Kontinuum von ALM Designs -->
# Überblick

\textcolor{darkblue}{Kontinuum von ALM-Designs}

\small
Extremszenario (1) Die Erwartungswerte aller Datenvariablen sind identisch.
\begin{align}
\begin{split}
y_i &\sim N(\mu,\sigma^2)
\quad \mbox{u.i.v. für} \quad
i = 1,...,n \quad \Leftrightarrow \\
y     &= X\beta + \varepsilon, \quad
X     := 1_n \in \mathbb{R}^{n\times 1}, \quad
\beta := \mu \in \mathbb{R}, \quad
\varepsilon \sim N(0_n,\sigma^2 I_n)
\end{split}
\end{align}

\vspace{-2mm}
$\Rightarrow$ Jegliche Datenvariabilität wird dem Fehlerterm zugeschrieben.

$\Rightarrow$ Es gilt \quad $\hat{\beta} = (1_n^\mathrm{T}1_n)^{-1}1_n^\mathrm{T}y = \bar{y}$ \quad und \quad $\hat{\sigma}^2 = \frac{1}{n-p} (y - 1_n\bar{y})^\mathrm{T}(y - 1_n\bar{y}) = s^2_y$.
\vspace{2mm}

Extremszenario (2) Die Erwartungswerte aller Datenvariablen sind paarweise verschieden.
\begin{align}
\begin{split}
y_i &\sim N(\mu_i,\sigma^2)
\quad \mbox{u.v. für} \quad
i = 1,...,n \quad \Leftrightarrow \\
y     &= X\beta + \varepsilon, \quad
X     := I_n \in \mathbb{R}^{n \times n}, \quad
\beta := (\mu_1,..., \mu_n)^\mathrm{T} \in \mathbb{R}^n, \quad
\varepsilon \sim N(0_n,\sigma^2 I_n)
\end{split}
\end{align}

\vspace{-2mm}
$\Rightarrow$ Jegliche Datenvariabilität wird dem Erwartungswertparameter zugeschrieben.

$\Rightarrow$ Es gilt \quad $\hat{\beta} = (I_n^\mathrm{T}I_n)^{-1}I_n^\mathrm{T}y = y$ \quad und \quad $\hat{\sigma}^2 = \frac{1}{n-p} (y - I_n y)^\mathrm{T}(y - I_n y) = 0$.
\vspace{2mm}

Beide Extremszenarien sind wissenschaftlich nicht ergiebig, da sie keine theoriegeleitete systematische Abhängigkeit zwischen unabhängigen und abhängigen Variablen (UV, AV) annehmen. Die im weiteren Verlauf betrachteten ALM-Designs liegen zwischen den beiden Extremszenarien und repräsentieren verschiedene Formen der systematischen Abhängigkeit zwischen UV und AV.


<!-- Überblick: Faktorielle und parametrische ALM-Designs -->
# Überblick

\textcolor{darkblue}{Faktorielle und parametrische ALM-Designs}

\small
Faktorielle ALM-Designs:
\vspace{-2mm}

* Designmatrizen mit $1$en und $0$en, manchmal $-1$en.
* Betaparameter repräsentieren Erwartungswerte für Gruppen.
* Betaparameterschätzer repräsentieren Stichprobenmittel für Gruppen.
* $\Rightarrow$ T-Tests, einfaktorielle Varianzanalyse, zweifaktorielle Varianzanalyse

Parametrische ALM-Designs:
\vspace{-2mm}

* Designmatrizen besitzen Spalten mit kontinuierlichen reellen Werten.
* Die Designmatrixsspalten werden *Regressoren*, *Prädiktoren*, oder *Kovariaten* genannt.
* Betaparameter repräsentieren Steigungsparameter.
* Betaparameterschätzer ergeben sich als normalisierte Kovarianzen von Regressoren und Daten.
* Es besteht ein enger Bezug zur Theorie der Korrelation.
* $\Rightarrow$ einfache lineare Regression, multiple lineare Regression

Faktoriell-parametrische ALM-Designs:
\vspace{-2mm}

* Designmatrizen mit mehreren faktoriellen und parametrischen Werten.
* Die parametrischen Regressoren werden oft als kontrollierte Kovariaten betrachtet.
* $\Rightarrow$ Kovarianzanalyse, (partielle Korrelation)


<!-- Überblick: ALM-Designs als Hypothesentestverfahren -->
# Überblick

\setstretch{1.5}
\textcolor{darkblue}{ALM-Designs als Hypothesentestverfahren$^\ast$}

Testen von Unterschiedshypothesen:

* Einstichproben-T-Tests
* Zweistichproben-T-Tests
* einfaktorielle Varianzanalyse
* zweifaktorielle Varianzanalyse
* Kovarianzanalyse

Testen von Zusammenhangshypothesen:

* einfache lineare Regression/Korrelation
* multiple lineare Regression/partielle Korrelation

$^\ast$ Diese Sichtweise wird durch Prof. Ostwald nicht favorisiert.


<!-- Überblick: T-Tests -->
# Überblick

\setstretch{1.5}
\textcolor{darkblue}{T-Tests}

\small
Es gibt viele T-Test-Varianten, jeweils mit eigenen Testgütefunktionen.

Wir fokussieren hier auf die Darstellung von T-Tests als Spezialfällen des ALMs.

Wir behandeln im Detail:
\vspace{-2mm}

* \justifying Einstichproben-T-Tests mit einfacher Nullhypothese und ungerichteter Alternativhypothese.
* Zweistichproben-T-Tests bei unabhängigen Stichproben unter Annahme identischer Varianzen mit einfacher Nullhypothese und ungerichteter Alternativhypothese (siehe Einheit (10) in *Allgemeines Lineares Modell*)

Wir behandeln nicht:
\vspace{-2mm}

* T-Tests mit gerichteten Hypothesen oder einfachen Null- und Alternativhypothesen.
* Zweistichproben-T-Tests bei Annahme verschiedener Varianzen (Behrends-Fischer-Problem).
* Zweistichproben T-Tests bei abhängigen Stichproben.


<!-- Inhaltsverzeichnis -->
#

\large
\setstretch{2}
\vfill

Anwendungsszenario

Modellformulierung

Modellschätzung

Modellevaluation

Anwendung/Praxis

Selbstkontrollfragen

\vfill


<!-- Abschnitt 1: Anwendungsszenario -->
#

\large
\setstretch{2}
\vfill

**Anwendungsszenario**

Modellformulierung

Modellschätzung

Modellevaluation

Anwendung/Praxis

Selbstkontrollfragen

\vfill


<!-- Anwendungsszenario -->
# Anwendungsszenario {.t}

\vspace{2mm}
\setstretch{2}
\textbf{\textcolor{darkblue}{Eine Gruppe}} (Stichprobe) randomisierter experimenteller Einheiten.

Annahme der unabhängigen und identischen Normalverteilung $N(\mu,\sigma^2)$.

$\mu$ und $\sigma^2$ unbekannt.

Quantifizieren der Unsicherheit beim inferentiellen Vergleich von $\mu$ mit $\mu_0$ beabsichtigt.


<!-- Anwendungsszenario -->
# Anwendungsszenario {.t}

\vspace{2mm}
\setstretch{1.8}
\textcolor{darkblue}{Anwendungsbeispiele}

\small
Pre-Post-Psychotherapie: BDI-Differenzanalyse einer Gruppe von Patient:innen

\vspace{-2mm}
* $\mu \neq \mu_0 := 0 \quad \Rightarrow$ Evidenz für Depressionsymptomatikveränderung

Gruppenanalysen mit *Wechsler Adult Intelligence Scale* (WAIS)

\vspace{-2mm}
* $\mu \neq \mu_0 := 100 \,  \Rightarrow$ Evidenz für über- oder unterdurchschnittliche WAIS-Performanz

Gruppenanalysen in der funktionellen Kernspintomographie (fMRT)

\vspace{-2mm}
* $\mu > \mu_0 := 0    \quad \Rightarrow$ Evidenz für regionale Gehirnaktivierung


<!-- Anwendungsszenario -->
# Anwendungsszenario {.t}

\vspace{2mm}
\textcolor{darkblue}{Anwendungsbeispiel}

```{r, echo = F, out.width = "90%", fig.align = "center"}
knitr::include_graphics("Abbildungen/beispielstudie_einstichproben-t-test.pdf")
```

\small
Wir nehmen an, dass die Datenpunkte unabhängige und identisch verteilte (u.i.v.) Realisierungen von ZVen $y_i \sim N(\mu,\sigma^2)$ sind und nehmen weiter an, dass wir sind an der Quantifizierung der Unsicherheit beim inferentiellen Vergleich des wahren, aber unbekannten Erwartungswertparameters $\mu$ im Sinne eines Hypothesentests interessiert sind.

```{r, eval = F, echo = F}
# Initialisierung
set.seed(1)                                                                      # Zufallszahlengenerator initialisieren

# Simulationsparameter
n_c    = 2                                                                       # Anzahl Gruppen
n_i    = 40                                                                      # Anzahl Proband:innen pro Gruppe
n      = n_c*n_i                                                                 # Gesamtanzahl Datenpunte
mu_pre = c(31, 32)                                                               # \mu pre F2F, ONL
mu_pos = c(27, 26)                                                               # \mu post F2F, ONL
sigsqr = 10                                                                      # \sigma^2

# Datensimulation
D            = data.frame("ID" = 1:n)                                            # Dataframe-Initialisierung und ID-Variable
D$Setting    = c(rep("F2F",n_i), rep("ONL", n_i))                                # Bedingung
D$PreBDI     = c(round(rnorm(n_i, mu_pre[1], sqrt(sigsqr))),                     # PreBDI
                 round(rnorm(n_i, mu_pre[2], sqrt(sigsqr))))
D$PostBDI    = c(round(rnorm(n_i, mu_pos[1], sqrt(sigsqr))),                     # PostBDI
                 round(rnorm(n_i, mu_pos[2], sqrt(sigsqr))))
D$dBDI       = -(D$PostBDI - D$PreBDI)                                           # -(PostBDI - PreBDI) = PreBDI - PostBDI

# Datenspeicherung
write.csv(D,
    file = "Daten/T-Tests_Daten.csv")
```


<!-- Abschnitt 2: Modellformulierung -->
#

\large
\setstretch{2}
\vfill

Anwendungsszenario

**Modellformulierung**

Modellschätzung

Modellevaluation

Anwendung/Praxis

Selbstkontrollfragen

\vfill


<!-- Modellformulierung -->
# Modellformulierung

\footnotesize
\begin{definition}[Einstichproben-T-Test-Modell]

\justifying
$y_i, i = 1,...,n$ seien Zufallsvariablen, die die $n$ Datenpunkte eines Anwendungsszenarios für den Einstichproben-T-Test modellieren. Dann hat das \textit{Einstichproben-T-Test-Modell} die strukturelle Form
\begin{equation}
y_i = \mu + \varepsilon_i
\quad \mbox{mit} \quad
\varepsilon_i \sim N(0,\sigma^2)
\quad \mbox{u.i.v. für} \quad
i = 1,...,n
\quad \mbox{mit} \quad
\mu \in \mathbb{R}
\quad \mbox{und} \quad
\sigma^2 > 0,
\end{equation}

die Datenverteilungsform
\begin{equation}
y_i \sim  N(\mu,\sigma^2)
\quad \mbox{u.i.v. für} \quad
i = 1,...,n
\quad \mbox{mit} \quad
\mu \in \mathbb{R}
\quad \mbox{und} \quad
\sigma^2 > 0,
\end{equation}

und für den Datenvektor $y = (y_1,...,y_n)^\mathrm{T}$ die Designmatrixform
\begin{equation}
y = X\beta + \varepsilon
\quad \mbox{mit} \quad
X := 1_n \in \mathbb{R}^{n \times 1}, \quad
\beta := \mu \in \mathbb{R}, \quad
\varepsilon \sim N(0_n,\sigma^2I_n),
\quad \mbox{und} \quad
\sigma^2 > 0.
\end{equation}

\end{definition}

Bemerkungen

* Das Modell ist identisch mit dem Modell unabhängiger und identisch normalverteilter Zufallsvariablen.
* Die Äquivalenz der drei Modellformen wurde bereits diskutiert (vgl. Einheit (5) in *Allgemeines Lineares Modell*).
* Die Anzahl der Betaparameter ist $p = 1$.


<!-- Designmatrix des Modells -->
# Modellformulierung

Designmatrix des Einstichproben-T-Test-Modells ($n = 20$, $p = 1$)

```{r, echo = F, eval = F}
# Designmatrixerzeugung
n      = 20                                  # Anzahl von Datenpunkten
X      = matrix(rep(1,n), nrow = n)          # n x p Designmatrix
Xp     = X

# Abbildungsparameter
library(plot.matrix)
graphics.off()
dev.new()
par(
    family    = "sans",
    mar       = c(1,1,1,1),
    pty       = "s",
    bty       = "l",
    lwd       = 1,
    las       = 1,
    mgp       = c(2,1,0),
    xaxs      = "i",
    yaxs      = "i",
    font.main = 1,
    cex       = 1,
    cex.main  = 2)

# Designmatrix
plot(Xp,
    col       = gray(seq(0, 1, length.out = 256)),
    border    = "black",
    xlab      = '',
    ylab      = '',
    main      = '',
    breaks    = seq(-1, 1, length.out = 257),
    key       = NULL,
    axis.col  = NULL,
    axis.row  = NULL,
    asp       = 1)

# Speichern
dev.copy2pdf(
    file      = "Abbildungen/designmatrix_einstichproben-t-test.pdf",
    width     = 10,
    height    = 10)
```

\vspace{2mm}
```{r, echo = F, out.width = "60%", fig.align = "center"}
knitr::include_graphics("Abbildungen/designmatrix_einstichproben-t-test.pdf")
```


<!-- Datensimulation -->
# Modellformulierung

\normalsize
Datensimulation (vgl. Einheit (5) in *Allgemeines Lineares Modell*)

\vspace{4mm}

\footnotesize
\setstretch{1.2}
```{r, echo = T}
# Modellformulierung
library(MASS)                                # multivariate Normalverteilung
n      = 20                                  # Anzahl von Datenpunkten
p      = 1                                   # Anzahl von Betaparametern
X      = matrix(rep(1,n), nrow = n)          # n x p Designmatrix
I_n    = diag(n)                             # n x n Einheitsmatrix
beta   = 5                                   # wahrer, aber unbekannter Betaparameter
sigsqr = 14                                  # wahrer, aber unbekannter Varianzparameter

# Datenrealisierung
y      = mvrnorm(1, X %*% beta, sigsqr*I_n)  # eine Realisierung des n-dimensionalen ZVs y
print(y)
```
\vfill


<!-- Abschnitt 3: Modellschätzung -->
#

\large
\setstretch{2}
\vfill

Anwendungsszenario

Modellformulierung

**Modellschätzung**

Modellevaluation

Anwendung/Praxis

Selbstkontrollfragen

\vfill


<!-- Theorem: Parameterschätzung im Einstichproben-T-Test-Modell -->
# Modellschätzung

\footnotesize
\begin{theorem}[Parameterschätzung im Einstichproben-T-Test-Modell]

\normalfont
\justifying
Gegeben sei die Designmatrixform des Einstichproben-T-Test-Modells. Dann ergeben sich für den Betaparameterschätzer
\begin{equation}
\hat{\beta} = \frac{1}{n}\sum_{i=1}^n y_i =: \bar{y}
\end{equation}

und für den Varianzparameterschätzer
\begin{equation}
\hat{\sigma}^2 = \frac{1}{n-1}\sum_{i=1}^n (y_i - \bar{y})^2 =: s_y^2 \; .
\end{equation}

\end{theorem}

Bemerkungen

* Die Formen von $\hat{\beta}$ und $\hat{\sigma}^2$ wurden bereits hergeleitet (siehe Einheit (6) in *Allgemeines Lineares Modell*).
* $\bar{y}$ und $s_y^2$ bezeichnen das Stichprobenmittel und die Stichprobenvarianz der $y_1,...,y_n$.


<!-- Modellschätzung -->
# Modellschätzung

\tiny
\setstretch{1.2}
```{r, echo = T}
# Daten einlesen
fname       = "Daten/T-Tests_Daten.csv"                             # Dateiname
D           = read.table(fname, sep = ",", header = TRUE)           # Dataframe
y           = D$dBDI[D$Setting == "F2F"]                            # BDI-Differenzwerte in der F2F-Gruppe

# Modellformulierung
n          = length(y)                                              # Anzahl Datenpunkte
p          = 1                                                      # Anzahl Betaparameter
X          = matrix(rep(1,n), nrow = n)                             # Designmatrix

# Modellschätzung
beta_hat   = solve(t(X) %*% X) %*% t(X) %*% y                       # Betaparameterschätzer
eps_hat    = y - X %*% beta_hat                                     # Residuenvektor
sigsqr_hat = (t(eps_hat) %*% eps_hat) /(n-p)                        # Varianzparameterschätzer

# Ausgabe
cat(  "hat{beta}   : ", beta_hat,                                   # Betaparameterschätzer
    "\nbar{y}      : ", mean(y),                                    # Stichprobenmittel
    "\nhat{sigsqr} : ", sigsqr_hat,                                 # Varianzparameterschätzer
    "\ns_y^2       : ", var(y))                                     # Stichprobenvarianz
```


<!-- Abschnitt 4: Modellevaluation -->
#

\large
\setstretch{2}
\vfill

Anwendungsszenario

Modellformulierung

Modellschätzung

**Modellevaluation**

Anwendung/Praxis

Selbstkontrollfragen

\vfill


<!-- Hypothesenszenarien -->
# Modellevaluation

\small
\textcolor{darkblue}{Hypothesenszenarien}

\setstretch{1.2}
Einfache Nullhypothese, einfache Alternativhypothese $H_0: \mu = \mu_0$, $H_1: \mu = \mu_1$
\begin{itemize}
\item theoretisch wichtiges Szenario (Neymann-Pearson-Lemma)
\item praktische Relevanz eher gering
\end{itemize}

Einfache Nullhypothese, zusammengesetzte Alternativhypothese $H_0: \mu = \mu_0$, $H_1: \mu \neq \mu_0$
\begin{itemize}
\item zweiseitiger Einstichproben-T-Test mit ungerichteter Hypothese
\item ungerichtete Fragestellung nach einem Unterschied
\end{itemize}

Zusammengesetzte Nullhypothese/Alternativhypothese $H_0: \mu \le \mu_0$, $H_1: \mu > \mu_0$
\begin{itemize}
\item einseitiger Einstichproben-T-Test mit gerichteter Hypothese
\item gerichtete Fragestellung nach einem positiven Unterschied
\end{itemize}

Zusammengesetzte Nullhypothese/Alternativhypothese $H_0: \mu \ge \mu_0$, $H_1: \mu < \mu_0$
\begin{itemize}
\item gerichtete Fragestellung nach einem negativen Unterschied
\item qualitativ äquivalente Theorie zum umgekehrten Fall
\end{itemize}


<!-- Hypothesenszenarien -->
# Modellevaluation

\small
\textcolor{darkblue}{Hypothesenszenarien}

\setstretch{1.2}
\textcolor{lightgray}{Einfache Nullhypothese, einfache Alternativhypothese $H_0: \mu = \mu_0$, $H_1: \mu = \mu_1$}
\begin{itemize}
\item[\textcolor{lightgray}{$\bullet$}] \textcolor{lightgray}{theoretisch wichtiges Szenario (Neymann-Pearson Lemma)}
\item[\textcolor{lightgray}{$\bullet$}] \textcolor{lightgray}{praktische Relevanz eher gering}
\end{itemize}

Einfache Nullhypothese, zusammengesetzte Alternativhypothese $H_0: \mu = \mu_0$, $H_1: \mu \neq \mu_0$
\begin{itemize}
\item zweiseitiger Einstichproben-T-Test mit ungerichteter Hypothese
\item ungerichtete Fragestellung nach einem Unterschied
\end{itemize}

\textcolor{lightgray}{Zusammengesetzte Nullhypothese/Alternativhypothese $H_0: \mu \le \mu_0$, $H_1: \mu > \mu_0$}
\begin{itemize}
\item[\textcolor{lightgray}{$\bullet$}] \textcolor{lightgray}{einseitiger Einstichproben-T-Test mit gerichteter Hypothese}
\item[\textcolor{lightgray}{$\bullet$}] \textcolor{lightgray}{gerichtete Fragestellung nach einem positiven Unterschied}
\end{itemize}

\textcolor{lightgray}{Zusammengesetzte Nullhypothese/Alternativhypothese $H_0: \mu \ge \mu_0$,$H_1: \mu < \mu_0$}
\begin{itemize}
\item[\textcolor{lightgray}{$\bullet$}] \textcolor{lightgray}{gerichtete Fragestellung nach einem negativen Unterschied}
\item[\textcolor{lightgray}{$\bullet$}] \textcolor{lightgray}{qualitativ äquivalente Theorie zum umgekehrten Fall}
\end{itemize}


<!-- Modellevaluation -->
# Modellevaluation

\small
\setstretch{2}
\textcolor{darkblue}{Gliederung} (vgl. [\textcolor{darkblue}{Einheit (12), um 01:58:00}](https://youtu.be/GJsS-AZe9zI?si=9kldNuX_I3bgjUFE&t=7080) in \textit{Wahrscheinlichkeitstheorie und Frequentistische Inferenz})

(1) Statistisches Modell $\checkmark$

(2) Testhypothesen $\checkmark$

(3) Teststatistik

(4) Test

(5) Analyse der Testgütefunktion

(6) Testumfangkontrolle

(7) p-Wert

(8) Analyse der Powerfunktion


<!-- Modellevaluation: Teststatistik -->
# Modellevaluation (3) Teststatistik

\setstretch{3}
\textcolor{darkblue}{Bezeichungskonventionen für $t$-Zufallsvariablen}

\small
* Für eine (nichtzentrale) $t$-Zufallsvariable $\xi$ schreiben wir $\xi \sim t(n)$ (oder $\xi \sim t(\delta, n)$).
* Die WDF einer (nichtzentralen) $t$-Zufallsvariable ist $t(\cdot;n)$ (oder $t(\cdot;\delta,n)$).
* Die KVF einer (nichtzentralen) $t$-Zufallsvariable ist $\psi(\cdot;n)$ (oder $\psi(\cdot;\delta,n)$).
* Die Teststatistik eines T-Test-Designs/Hypothesentests bezeichnen wir mit $T$.
* Die Realisierung der T-Teststatistik für einen Datensatz bezeichnen wir mit $t$.
\vfill


<!-- Theorem: T-Teststatistik des Einstichproben-T-Tests -->
# Modellevaluation (3) Teststatistik

\footnotesize
\begin{theorem}[T-Teststatistik des Einstichproben-T-Tests]

\normalfont
\justifying
Gegeben sei die Designmatrixform des Einstichproben-T-Test-Modells. Dann ergibt sich für die T-Teststatistik mit
\begin{equation}
c := 1
\quad \mbox{und} \quad
\beta_0 =: \mu_0,
\end{equation}

dass
\begin{equation}
T = \sqrt{n}\left(\frac{\bar{y} - \mu_0}{s_y}\right)
\end{equation}

und es gilt
\begin{equation}
T \sim t(\delta, n-1)
\quad \mbox{mit} \quad
\delta = \sqrt{n}\left(\frac{\mu - \mu_0}{\sigma}\right).
\end{equation}

\end{theorem}

Bemerkungen

* Das Theorem basiert auf der T-Statistik im Rahmen des ALM.
* Wir erinnern an das verwandte populäre und von der Stichprobengröße unabhängige Effekstärke-Maß *Cohen's* $d$ bei Einstichproben-T-Test-Designs,
\begin{equation}
d := \frac{\bar{y}}{s_y}.
\end{equation}
* Offenbar gilt für *Cohen's* $d$, dass mit $\mu_0 := 0$
\begin{equation}
T = \sqrt{n}d
\quad \Leftrightarrow \quad
d = T/\sqrt{n}.
\end{equation}


<!-- Beweis -->
# Modellevaluation (3) Teststatistik

\footnotesize
\underline{Beweis}

Mit dem Theorem zur Verteilung der T-Statistik (siehe Einheit (7) in *Allgemeines Lineares Modell*) gilt
\begin{equation}
T
= \frac{c^\mathrm{T} \hat{\beta} - c^\mathrm{T} \beta_0}{\sqrt{\hat{\sigma}^2 c^\mathrm{T} (X^\mathrm{T}X)^{-1}c}}
= \frac{1^\mathrm{T} \bar{y} - 1^\mathrm{T} \mu_0}{\sqrt{s_y^2 1^\mathrm{T} (1_n^\mathrm{T}1_n)^{-1}1}}
= \sqrt{n}\left(\frac{\bar{y} - \mu_0}{s_y}\right).
\end{equation}
\vspace{2mm}

Weiterhin gilt mit demselben Theorem
\begin{equation}
\delta
= \frac{c^\mathrm{T} \beta - c^\mathrm{T} \beta_0}{\sqrt{\sigma^2 c^\mathrm{T} (X^\mathrm{T}X)^{-1}c}}
= \frac{1^\mathrm{T} \mu   - 1^\mathrm{T} \mu_0  }{\sqrt{\sigma^2 1^\mathrm{T} (1_n^\mathrm{T} 1_n)^{-1}1}}
= \sqrt{n}\left(\frac{\mu - \mu_0}{\sigma}\right).
\end{equation}
$\hfill\Box$


<!-- Definition: Zweiseitiger Einstichproben-T-Tests -->
# Modellevaluation (4) Test

\footnotesize
\begin{definition}[Zweiseitiger Einstichproben-T-Tests]

\justifying
Gegeben sei das Einstichproben-T-Test-Modell. Für ein $\mu_0 \in \mathbb{R}$ seien die einfache Nullhypothese und die zusammengesetzte Alternativhypothese als
\begin{equation}
H_0 : \mu = \mu_0
\quad \mbox{und} \quad
H_1 : \mu \neq \mu_0
\end{equation}

definiert. Weiterhin sei die T-Teststatistik definiert als
\begin{equation}
T := \sqrt{n}\left(\frac{\bar{y} - \mu_0}{s_y}\right)
\end{equation}

Dann ist der \textit{zweiseitige Einstichproben-T-Tests} definiert als der kritische-Wert-basierte Test
\begin{equation}
\phi(y) := 1_{\{|T| \ge k\}} =
{\begin{cases}
1 & |T| \ge k \\
0 & |T|  <  k
\end{cases}}.
\end{equation}

\end{definition}

Bemerkungen

* Ausführlicher handelt es sich um den *zweiseitigen Einstichproben-T-Test mit ungerichteter Hypothese*.


<!-- Theorem: Testgütefunktion -->
# Modellevaluation (5) Analyse der Testgütefunktion

\small
\begin{theorem}[Testgütefunktion]

\justifying
\normalfont
$\phi$ sei der im obigen Testszenario definierte Test. Dann ist die Testgütefunktion von $\phi$ gegeben durch
\begin{equation}
q_{\phi} : \mathbb{R} \to [0,1],
\mu \mapsto q_{\phi}(\mu)
:= 1 - \psi(k;\delta,n-1) + \psi(-k;\delta,n-1)
\end{equation}

wobei $\psi(\cdot; \delta, n-1)$ die KVF der nichtzentralen $t$-Verteilung mit Nichtzentralitätsparameter
\begin{equation}
\delta := \sqrt{n}\left(\frac{\mu - \mu_0}{\sigma}\right)
\end{equation}

und Freiheitsgradparameter $n-1$ bezeichnet.

\end{theorem}


<!-- Analyse der Testgütefunktion -->
# Modellevaluation (5) Analyse der Testgütefunktion

\small
\center
Testgütefunktion $q_\phi$ für $\sigma^2 = 9, \mu_0 = 4, n = 12$ und $k = 1,2,3$.
\vspace{2mm}
\begin{equation*}
\quad q_{\phi}(\mu) = \mathbb{P}_\mu(\phi = 1)
\end{equation*}

```{r, echo = F, eval = F}
dev.new()
graphics.off()
par(
    family      = "sans",
    bty         = "l",
    lwd         = 1,
    las         = 1,
    mgp         = c(2,1,0),
    xaxs        = "i",
    yaxs        = "i",
    font.main   = 1,
    cex         = 1.1,
    cex.main    = 1.1)

# Parameter
mu_0        = 4
n           = 12
sigsqr      = 9
sigma       = sqrt(9)
k           = c(1,2,3)
mu          = matrix(seq(0, 8,len = 1e3), nrow = 1e3)
d           = sqrt(n)*(mu - mu_0)/sigma
q_mu        = cbind(matrix(1-pt(k[1],n-1,d)+ pt(-k[1],n-1,d),nrow=length(mu)),
                    matrix(1-pt(k[2],n-1,d)+ pt(-k[2],n-1,d),nrow=length(mu)),
                    matrix(1-pt(k[3],n-1,d)+ pt(-k[3],n-1,d),nrow=length(mu)))

# Visualisierung
matplot(mu, q_mu,
    type        = "l",
    lty         = c(1,2,3),
    col         = "black",
    lwd         = 2,
    xlab        = "",
    ylab        = "",
    ylim        = c(0,1.05))
lines(4, 0,
    pty         = "p",
    pch         = 16,
    xpd         = TRUE)
legend(6, 0.4, c("k = 1", "k = 2", "k = 3"),
    lty         = c(1,2,3),
    col         = "black",
    bty         = "n")
    y.intersp   = 3)
text(8.3, -0.01, TeX("$\\mu$")                        , cex = 1.1, xpd = TRUE)
text(4  , -0.25, TeX("$H_0\\,:\\, \\mu = \\mu_0$")    , cex = 1.1, xpd = TRUE)
text(2  , -0.35, TeX("$H_1\\,:\\, \\mu \\neq \\mu_0$"), cex = 1.1, xpd = TRUE)
text(6  , -0.35, TeX("$H_1\\,:\\, \\mu \\neq \\mu_0$"), cex = 1.1, xpd = TRUE)
dev.copy2pdf(
    file        = "Abbildungen/t_test_ungerichtet_guetefunktion.pdf",
    width       = 7,
    height      = 4)
```

```{r, echo = F, out.width = "80%"}
knitr::include_graphics("Abbildungen/t_test_ungerichtet_guetefunktion.pdf")
```


<!-- Beweis -->
# Modellevaluation (5) Analyse der Testgütefunktion

\small
\underline{Beweis}

Die Testgütefunktion des betrachteten Test im vorliegenden Testszenario ist definiert als
\begin{equation}
q_{\phi} : \mathbb{R} \to [0,1],
\mu \mapsto q_{\phi}(\mu) := \mathbb{P}_{\mu}(\phi = 1).
\end{equation}

Da die Wahrscheinlichkeiten für $\phi = 1$ und dafür, dass die zugehörige Teststatistik im Ablehnungsbereich des Tests liegt, gleich sind, benötigen wir also zunächst die Verteilung der Teststatistik. Wir haben oben bereits gesehen, dass die T-Teststatistik
\begin{equation}
T := \sqrt{n}\left(\frac{\bar{y} - \mu_0}{s_y} \right)
\end{equation}

unter der Annahme $y_i \sim N(\mu,\sigma^2) \mbox{ u.i.v. für } i = 1,...,n$ nach einer nichtzentralen $t$-Verteilung $t(\delta,n-1)$ mit Nichtzentralitätsparameter
\begin{equation}
\delta = \sqrt{n}\left(\frac{\mu - \mu_0}{\sigma}\right)
\end{equation}

verteilt ist. Der Ablehnungsbereich des zweiseitigen T-Tests ergibt sich, wie in ähnlicher Form bei der Betrachtung des zweiseitigen Z-Tests gesehen, zu
\begin{equation}
A = \,]-\infty, -k]\, \cup \,]k,\infty[.
\end{equation}
\vfill


<!-- Beweis -->
# Modellevaluation (5) Analyse der Testgütefunktion

\small
\underline{Beweis (fortgeführt)}

Mit diesem Ablehungsbereich ergibt sich dann
\begin{align}
\begin{split}
q_\phi(\mu)
& = \mathbb{P}_{\mu}(\phi = 1)                                  \\
& = \mathbb{P}_{\mu}\left(T \in ]-\infty, -k]\,
                         \cup \,]k,\infty[ \right)              \\
& = \mathbb{P}_{\mu}\left(T \in ]-\infty, -k]\right)
  + \mathbb{P}_{\mu}\left(T \in [k,\infty[ \right)              \\
& = \mathbb{P}_{\mu}(T \le -k) + \mathbb{P}_{\mu}(T \ge k)      \\
& = \mathbb{P}_{\mu}(T \le -k) + (1-\mathbb{P}_{\mu}(T \le k))  \\
& = 1 - \mathbb{P}_{\mu}(T \le k) + \mathbb{P}_{\mu}(T \le - k) \\
& = 1 - \psi(k; \delta, n-1)  + \psi(-k;\delta,n-1),
\end{split}
\end{align}

wobei $\psi(\cdot; \delta,n-1)$ die KVF der nichtzentralen T-Verteilung mit
Nichtzentralitätsparameter $\delta$ und Freiheitsgradparameter $n-1$ bezeichnet.
$\hfill\Box$
\vfill


<!-- Theorem: Testumfangkontrolle -->
# Modellevaluation (6) Testumfangkontrolle

\vfill
\small
\begin{theorem}[Testumfangkontrolle]

\justifying
\normalfont
$\phi$ sei der im obigen Testszenario definierte Test. Dann ist $\phi$ ein Level-$\alpha_0$-Test mit Testumfang $\alpha_0$, wenn der kritische Wert definiert ist durch
\begin{equation}
k_{\alpha_0} := \psi^{-1}\left(1 - \frac{\alpha_0}{2}; n-1 \right),
\end{equation}

wobei $\psi^{-1}(\cdot; n-1)$ die inverse KVF der $t$-Verteilung mit $n-1$ Freiheitsgraden ist.

\end{theorem}

\vfill


<!-- Visualisierung -->
# Modellevaluation (6) Testumfangkontrolle

\small
\center
Wahl von $k_{\alpha_0} := \psi^{-1}(1 - \alpha_0/2; n-1)$ mit $n =12$, $\alpha_0 := 0.05$ und Ablehnungsbereich
\vspace{2mm}

```{r, echo = F, eval = F}
dev.new()
graphics.off()
par(
    family      = "sans",
    mfcol       = c(1,2),
    pty         = "m",
    bty         = "l",
    lwd         = 1,
    las         = 1,
    mgp         = c(2,1,0),
    xaxs        = "i",
    yaxs        = "i",
    font.main   = 1,
    cex         = 1,
    cex.main    = 1.2)

# Parameter
n           = 12
alpha_0     = 0.05                                                               # Konfidenzniveau
k_alpha_0   = qt(1 - alpha_0/2, n-1)                                             # kritischer Wert
t           = seq(-4, 4, length=1e4)                                             # T-Statistikwerte
Pt          = pt(t,n-1)                                                          # T-Statistik KVF für H_0
pt          = dt(t,n-1)                                                          # T-Statistik WDF für H_0

# KVF-Perspektive
plot(t, Pt,
    type        = "l",
    ylab        = " ",
    ylim        = c(0,1),
    main        = TeX("$\\psi$"))
lines(k_alpha_0, 0,
    type        = "p",
    pch         = 16,
    xpd         = TRUE)
lines(min(t), 1 - alpha_0/2,
    type        = "p",
    pch         = 16,
    xpd         = TRUE)
arrows(
    x0          = min(t),
    y0          = 1 - alpha_0/2,
    x1          = k_alpha_0,
    y1          = 1 - alpha_0/2,
    col         = "darkorange",
    angle       = 45,
    length      = .1)
arrows(
    x0          = k_alpha_0,
    y0          = 1-alpha_0/2,
    x1          = k_alpha_0,
    y1          = 0,
    col         = "darkorange",
    angle       = 45,
    length      = .1)
text(k_alpha_0, -0.25, TeX("$\\k_{\\alpha_0}$"), xpd = TRUE)
text(       -3,  1.05, TeX("$1 - \\alpha_0/2$"), xpd = TRUE)

# WDF-Perspektive
plot(t, pt,
    type        = "l",
    ylab        = " ",
    ylim        = c(0,.4),
    main        = TeX("$t$"))
polygon(c(t[t  <= -k_alpha_0], 0, 0),
        c(pt[t <= -k_alpha_0], min(t), -k_alpha_0),
    col         = "gray90",
    border      = NA)
polygon(c(t[t  >= k_alpha_0], max(t), k_alpha_0),
        c(pt[t >= k_alpha_0], 0, 0),
    col         = "gray90",
    border      = NA)
lines(seq(min(t), -k_alpha_0, len = 1e2), rep(0,1e2),
    type        = "l",
    lwd         = 5,
    col         = "darkorange")
lines(seq(k_alpha_0, max(t), len = 1e2), rep(0,1e2),
    type        = "l",
    lwd         = 5,
    col         = "darkorange")
lines(-k_alpha_0, 0,
    type        = "p",
    pch         = 16,
    xpd         = TRUE)
lines(k_alpha_0, 0,
    type        = "p",
    pch         = 16,
    xpd         = TRUE)
text(-k_alpha_0, -0.11, TeX("$-\\k_{\\alpha_0}$"), xpd = TRUE)
text( k_alpha_0, -0.11, TeX("$\\k_{\\alpha_0}$") , xpd = TRUE)
text( 3, 0.05 , TeX("$P(T > = k_{\\alpha_0}) = \\alpha_0/2$"), xpd = TRUE, cex = .8, col = "gray50")
text(-3, 0.05 , TeX("$P(T < = k_{\\alpha_0}) = \\alpha_0/2$"), xpd = TRUE, cex = .8, col = "gray50")

dev.copy2pdf(
    file        = "Abbildungen/t_test_ungerichtet_testumfangkontrolle.pdf",
    width       = 8,
    height      = 4)
```

```{r, echo = F, out.width = "90%"}
knitr::include_graphics("Abbildungen/t_test_ungerichtet_testumfangkontrolle.pdf")
```


<!-- Beweis -->
# Modellevaluation (6) Testumfangkontrolle

\footnotesize
\setstretch{1.1}
\underline{Beweis}

Damit der betrachtete Test ein Level-$\alpha_0$-Test ist, muss bekanntlich $q_\phi(\mu) \le \alpha_0$ für alle $\mu \in \{\mu_0\}$, also hier $q_\phi(\mu_0) \le \alpha_0$, gelten. Weiterhin ist der Testumfang des betrachteten Tests durch $\alpha = \max_{\mu \in \{\mu_0\}} q_\phi(\mu)$, also hier durch $\alpha = q_\phi(\mu_0)$ gegeben. Wir  müssen also zeigen, dass die Wahl von $k_{\alpha_0}$ garantiert, dass $\phi$ ein Level-$\alpha_0$-Test mit Testumfang $\alpha_0$ ist. Dazu merken wir zunächst an, dass für $\mu = \mu_0$ gilt, dass
\begin{align}
\begin{split}
q_\phi(\mu_0)
& =  1 - \psi(k;\delta,n-1) + \psi(-k;\delta,n-1) \\
& =  1 - \psi(k;0,n-1) + \psi(-k;0,n-1)           \\
& =  1 - \psi(k;n-1) + \psi(-k;n-1),
\end{split}
\end{align}

wobei $\psi(\cdot;\delta,n-1)$ und $\psi(\cdot;n-1)$ die KVF der nichtzentralen $t$-Verteilung mit Nichtzentralitätsparameter $\delta$ und Freiheitsgradparameter $n-1$ bzw. der $t$-Verteilung mit Freiheitsgradparameter $n-1$ bezeichnen. Mit $k := k_{\alpha_0}$ gilt dann
\begin{align}
\begin{split}
q_\phi(\mu_0)
& = 1 - \psi(k_{\alpha_0}; n-1) + \psi(-k_{\alpha_0}; n-1)                          \\
& = 1 - \psi(k_{\alpha_0}; n-1) + (1 - \psi(k_{\alpha_0}; n-1))                     \\
& = 2(1-\psi(k_{\alpha_0}; n-1))                                                    \\
& = 2\left(1-\psi\left(\psi^{-1}\left(1 - \alpha_0/2; n-1\right); n-1\right)\right) \\
& = 2\left(1 - (1 - \alpha_0/2)\right)                                              \\
& = \alpha_0,
\end{split}
\end{align}

wobei die zweite Gleichung mit der Symmetrie der $t$-Verteilung folgt. Es folgt also direkt, dass bei der Wahl von $k = k_{\alpha_0}$, $q_\phi(\mu_0)\le \alpha_0$ ist und der betrachtete Test somit ein Level-$\alpha_0$-Test ist. Weiterhin folgt direkt, dass der Testumfang des betrachteten Tests bei der Wahl von $k = k_{\alpha_0}$ gleich $\alpha_0$ ist.
$\hfill\Box$


<!-- Praktisches Vorgehen -->
# Modellevaluation (6) Testumfangkontrolle

Praktisches Vorgehen
\small

* \justifying Man nimmt an, dass ein Datensatz $y_1,...,y_n$ eine Realisation von $y_i \sim N(\mu,\sigma^2) \mbox{ u.i.v. für } i = 1,...,n$ mit unbekannten Parametern $\mu$ und $\sigma^2 > 0$ ist.

* Man möchte entscheiden ob für ein $\mu_0 \in \mathbb{R}$ eher $H_0 : \mu = \mu_0$ oder $H_1: \mu \neq \mu_0$ zutrifft.

* Man wählt ein Signifikanzniveau $\alpha_0$ und bestimmt den zugehörigen Freiheitsgradparameter-abhängigen kritischen Wert $k_{\alpha_0}$. Zum Beispiel gilt bei Wahl von $\alpha_0  := 0.05$ und $n=12$, dass $k_{0.05}=\psi^{-1}(1 - 0.05/2; 12 - 1) \approx 2.20$ ist.

* Anhand von $n, \mu_0, \bar{y}$ und $s_y$ berechnet man die Realisierung der T-Teststatistik
\begin{equation}
t:= \sqrt{n}\left(\frac{\bar{y} - \mu_0}{s_y}\right)
\end{equation}

* Wenn $t$ größer-gleich $k_{\alpha_0}$ ist oder wenn $t$ kleiner-gleich $-k_{\alpha_0}$ ist, lehnt man die Nullhypothese ab, andernfalls lehnt man sie nicht ab.

* Die oben entwickelte Theorie  garantiert dann, dass man in höchstens $\alpha_0 \cdot 100$ von $100$ Fällen die Nullhypothese fälschlicherweise ablehnt.


<!-- Bestimmung des p-Wertes -->
# Modellevaluation (7) p-Wert

Bestimmung des p-Wertes
\small

* \justifying Per Definition ist der p-Wert das kleinste Signifikanzlevel $\alpha_0$, bei welchem man die Nullhypothese basierend auf einem vorliegendem Wert der Teststatistik ablehnen würde.

* Bei $T = t$ würde $H_0$ für jedes $\alpha_0$ mit $|t| \ge \psi^{-1}(1-\alpha_0/2; n-1)$ abgelehnt werden. Für diese $\alpha_0$ gilt, wie unten gezeigt,
\begin{equation}
\alpha_0 \ge 2 \mathbb{P}(T \ge |t|).
\end{equation}

* Das kleinste $\alpha_0 \in [0,1]$ mit $\alpha_0 \ge 2 \mathbb{P}(T \ge |t|)$ ist dann $\alpha_0 = 2 \mathbb{P}(T \ge |t|)$, also folgt
\begin{equation}
\mbox{p-Wert} =  2 \mathbb{P}(T \ge |t|) = 2(1 - \psi(|t|;n-1)).
\end{equation}

* Im Gegensatz zum Z-Test hängt bei T-Tests der p-Wert auch von der Stichprobengröße ab.

* Zum Beispiel ist für $t = 2.00$ und $n = 10$ der p-Wert $0.076$, für $t = 2.00$ und $n = 100$ ist der p-Wert dagegen $0.048$.


<!-- Bestimmung des p-Wertes -->
# Modellevaluation (7) p-Wert

Bestimmung des p-Wertes
\small

* \justifying Es bleibt zu zeigen, dass gilt
\begin{equation}
|t| \ge \psi^{-1}(1 - \alpha_0/2; n-1)
\quad \Leftrightarrow \quad
\alpha_0 \ge 2 \mathbb{P}(T \ge |t|) \; .
\end{equation}

* Dies aber folgt aus
\footnotesize
\vspace{-2mm}
\begin{align}
\begin{split}
|t|
& \ge \psi^{-1}\left(1 - \frac{\alpha_0}{2}; n-1\right) \\
\Leftrightarrow \psi(|t|; n-1)
& \ge \psi\left(\psi^{-1}\left(1 - \frac{\alpha_0}{2}; n-1\right); n-1\right) \\
\Leftrightarrow \psi(|t|; n-1)
& \ge 1 - \frac{\alpha_0}{2} \\
\Leftrightarrow \mathbb{P}(T \le |t|)
& \ge 1 - \frac{\alpha_0}{2} \\
\Leftrightarrow \frac{\alpha_0}{2}
& \ge 1 - \mathbb{P}(T \le |t|) \\
\Leftrightarrow \frac{\alpha_0}{2}
& \ge \mathbb{P}(T \ge |t|) \\
\Leftrightarrow \alpha_0
& \ge 2 \mathbb{P}(T \ge |t|) \; .
\end{split}
\end{align}


<!-- Analyse der Powerfunktion -->
# Modellevaluation (8) Analyse der Powerfunktion

\small
Wir betrachten die Testgütefunktion
\begin{equation}
q_\phi : \mathbb{R} \to [0,1],
\mu \mapsto q_\phi(\mu)
:= 1 - \psi(k_{\alpha_0}; \delta, n-1) + \psi(-k_{\alpha_0}; \delta, n-1)
\end{equation}

bei kontrolliertem Testumfang, also für $k_{\alpha_0} := \psi^{-1}(1-\alpha_0/2; n-1)$ mit festem $\alpha_0$ als Funktion des Nichtzentralitätsparameters und des Stichprobenumfangs. Namentlich hängt hier $k_{\alpha_0}$ sowohl von $\alpha_0$ als auch von $n$ ab.

Es ergibt sich die bivariate reellwertige Funktion
\begin{equation}
\pi : \mathbb{R} \times \mathbb{N} \to [0,1],
(\delta,n) \mapsto
\pi(\delta,n) := 1 - \psi(k_{\alpha_0}; \delta, n-1) + \psi(-k_{\alpha_0}; \delta, n-1)
\end{equation}
Bei festgelegten $\alpha_0$ hängt die Powerfunktion des zweiseitigen T-Tests mit einfacher Nullhypothese also vom unbekannten Wert $\delta$ und von der Stichprobengröße $n$ ab. Wir visualisieren diese Abhängigkeiten untenstehend.


<!-- Visualisierung -->
# Modellevaluation (8) Analyse der Powerfunktion

\small
Powerfunktion für $\alpha_0 = 0.05$

```{r, eval = F, echo = F}
dev.new()
graphics.off()
par(
    family      = "sans",
    mfcol       = c(1,1),
    pty         = "m",
    bty         = "l",
    lwd         = 1,
    las         = 1,
    xaxs        = "i",
    yaxs        = "i",
    font.main   = 1,
    cex         = 1.2,
    cex.main    = 1.2)

# Szenariospezifikation
d_min       = -5                                # delta Minimum
d_max       =  5                                # delta Maximum
d_res       = 50                                # delta Auflösung
delta       = seq(d_min, d_max, len = d_res)    # delta Raum
n_min       = 1                                 # n Minimum
n_max       = 30                                # n Maximum
n_res       = 50                                # n Auflösung
n           = seq(n_min,n_max, len = n_res)     # n Raum

# Berechnung
alpha_0   = 0.05
pi        = matrix(rep(NaN, d_res*n_res), nrow = d_res)
for(i in 1:d_res){
    for(j in 1:n_res){
        k_alpha_0 = qt(1 - alpha_0/2, n[j]-1)
        pi[i,j]   = 1-pt(k_alpha_0, n[j]-1, delta[i])+pt(-k_alpha_0, n[j]-1, delta[i])
    }
}

# Visualisierung
persp(delta, n, pi,
    d           = 1,
    col         = "gray90",
    theta       = 21,
    phi         = 30,
    lwd         = 0.5,
    scale       = T,
    ticktype    = "detailed",
    r           = 1.5)
dev.copy2pdf(
    file        = "Abbildungen/t_test_ungerichtet_power_005.pdf",
    width       = 7,
    height      = 7)
```

```{r, echo = F, out.width = "65%", fig.align = "center"}
knitr::include_graphics("Abbildungen/t_test_ungerichtet_power_005.pdf")
```


<!-- Visualisierung -->
# Modellevaluation (8) Analyse der Powerfunktion

\small
Powerfunktion für $\alpha_0 = 0.001$

```{r, eval = F, echo = F}
dev.new()
graphics.off()
par(
    family      = "sans",
    mfcol       = c(1,1),
    pty         = "m",
    bty         = "l",
    lwd         = 1,
    las         = 1,
    xaxs        = "i",
    yaxs        = "i",
    font.main   = 1,
    cex         = 1.2,
    cex.main    = 1.2)

# Szenariospezifikation
d_min       = -5                                # delta Minimum
d_max       =  5                                # delta Maximum
d_res       = 50                                # delta Auflösung
delta       = seq(d_min, d_max, len = d_res)    # delta Raum
n_min       = 1                                 # n Minimum
n_max       = 30                                # n Maximum
n_res       = 50                                # n Auflösung
n           = seq(n_min,n_max, len = n_res)     # n Raum

# Berechnung
alpha_0   = 0.001
pi        = matrix(rep(NaN, d_res*n_res), nrow = d_res)
for(i in 1:d_res){
    for(j in 1:n_res){
        k_alpha_0 = qt(1 - alpha_0/2, n[j]-1)
        pi[i,j]   = 1-pt(k_alpha_0, n[j]-1, delta[i])+pt(-k_alpha_0, n[j]-1, delta[i])
    }
}

# Visualisierung
persp(delta, n, pi,
    d           = 1,
    col         = "gray90",
    theta       = 21,
    phi         = 30,
    lwd         = 0.5,
    scale       = T,
    ticktype    = "detailed",
    r           = 1.5)
dev.copy2pdf(
    file        = "Abbildungen/t_test_ungerichtet_power_0001.pdf",
    width       = 7,
    height      = 7)
```

```{r, echo = F, out.width = "65%", fig.align = "center"}
knitr::include_graphics("Abbildungen/t_test_ungerichtet_power_0001.pdf")
```


<!-- Visualisierung -->
# Modellevaluation (8) Analyse der Powerfunktion

\small
Powerfunktionen für $\mu_0 = 0$

\vspace{2mm}
```{r, echo = F, eval = F}
dev.new()
graphics.off()
library(latex2exp)
par(
    family      = "sans",
    mfcol       = c(2,2),
    pty         = "m",
    bty         = "l",
    lwd         = 1,
    las         = 1,
    xaxs        = "i",
    yaxs        = "i",
    font.main   = 1,
    cex         = 1,
    cex.main    = 1)

# Szenariospezifikation
mu_0      = 0                                 # einfache Nullhypothese
d_min     = -5                                # d Minimum
d_max     =  5                                # d Maximum
d_res     = 50                                # d Auflösung
d         = seq(d_min, d_max, len = d_res)    # d Raum
n_min     = 2                                 # n Minimum
n_max     = 50                                # n Maximum
n_res     = 1e2                               # n Auflösung
n         = seq(n_min,n_max, len = n_res)     # n Raum

# Funktion von d, n = 12, \alpha_0 = 0.05
alpha_0   = 0.05
n_fix     = 12
k_alpha_0 = qt(1 - alpha_0/2, n_fix-1)
pi_d      = 1-pt(k_alpha_0, n_fix-1, d)+pt(-k_alpha_0, n_fix-1, d)
plot(d, pi_d,
    type      = "l",
    lwd       = 2,
    ylim      = c(0,1),
    ylab      = " ",
    xlab      = TeX("$\\delta$"),
    main      = TeX("$\\pi(\\delta,n = 12),\\, \\alpha_0 = 0.05$"))

# Funktion von d, n = 12, \alpha_0 = 0.001
alpha_0   = 0.001
n_fix     = 12
k_alpha_0 = qt(1-alpha_0/2, n_fix-1)
pi_d      = 1-pt(k_alpha_0, n_fix-1, d)+pt(-k_alpha_0, n_fix-1, d)
plot(d, pi_d,
    type      = "l",
    lwd       = 2,
    ylim      = c(0,1),
    ylab      = " ",
    xlab      = TeX("$\\delta$"),
    main      = TeX("$\\pi(\\delta,n = 12),\\, \\alpha_0 = 0.001$"))

# Funktion von n, \delta = 3, \alpha_0 = 0.05
alpha_0   = 0.05
d_fix     = 3
k_alpha_0 = qt(1-alpha_0/2, n-1)
pi_n      = 1-pt(k_alpha_0, n-1, d_fix)+pt(-k_alpha_0, n-1, d_fix)
plot(n, pi_n,
    type      = "l",
    lwd       = 2,
    ylab      = " ",
    ylim      = c(0,1),
    xlab      = TeX("$n$"),
    main      = TeX("$\\pi(\\delta = 3,n),\\, \\alpha_0 = 0.05$"))

# Funktion von n, \delta = 3, \alpha_0 = 0.001
alpha_0   = 0.001
d_fix     = 3
k_alpha_0 = qt(1-alpha_0/2, n-1)
pi_n      = 1-pt(k_alpha_0, n-1, d_fix)+pt(-k_alpha_0, n-1, d_fix)
plot(n, pi_n,
    type      = "l",
    lwd       = 2,
    ylab      = " ",
    ylim      = c(0,1),
    xlab      = TeX("$n$"),
    main      = TeX("$\\pi(\\delta = 3,n),\\, \\alpha_0 = 0.001$"))

# Speichern
dev.copy2pdf(
    file      = "Abbildungen/t_test_ungerichtet_powerfunktionen.pdf",
    width     = 8,
    height    = 7)
```

```{r, echo = F, out.width = "65%", fig.align = "center"}
knitr::include_graphics("Abbildungen/t_test_ungerichtet_powerfunktionen.pdf")
```


<!-- Praktisches Vorgehen -->
# Modellevaluation (8) Analyse der Powerfunktion

Praktisches Vorgehen
\small

Mit größerem $n$ steigt die Powerfunktion des Tests an:

* Ein großer Stichprobenumfang ist besser als ein kleiner Stichprobenumfang.

* Kosten für die Erhöhung des Stichprobenumfangs werden aber nicht berücksichtigt.

$\Rightarrow$ Die Theorie statistischer Hypothesentests ist nicht besonders lebensnah.

\vspace{1mm}

Die Powerfunktion hängt vom wahren, aber unbekannten Wert $\delta = \sqrt{n}\left(\frac{\mu - \mu_0}{\sigma}\right)$ ab.

$\Rightarrow$ Wenn man $\delta$ schon kennen würde, würde man den Test nicht durchführen.

\vspace{4mm}

Generell wird folgendes Vorgehen favorisiert:

* Man legt das Signifikanzniveau $\alpha_0$ fest und evaluiert die Powerfunktion.

* Man wählt einen Mindestparameterwert $\delta^*$, den man mit $\pi(\delta,n) = b$ detektieren möchte.

* Ein konventioneller Wert ist $b = 0.8$.

* Man liest die für $\pi(\delta = \delta^*,n) = b$ nötige Stichprobengröße $n$ ab.


<!-- Visualisierung -->
# Modellevaluation (8) Analyse der Powerfunktion

Praktisches Vorgehen

\vspace{4mm}
```{r, echo = F, eval = F}
# Szenariospezifikation
sigma     = 1                                                       # bekanntes \sigma
mu_0      = 0                                                       # einfache Nullhypothese
n_min     = 2                                                       # n Minimum
n_max     = 20                                                      # n Maximum
n_res     = 1e2                                                     # n Auflösung
n         = seq(n_min,n_max, len = n_res)                           # n Raum
alpha_0   = 0.05                                                    # Signifikanzniveau

# Poweranalyse
d_fix     = 3                                                       # fester Nichtzentralitätsparameter
k_alpha_0 = qt(1-alpha_0/2, n-1)                                    # kritische Werte
pi_n      = 1-pt(k_alpha_0, n-1, d_fix)+pt(-k_alpha_0, n-1, d_fix)  # Powerfunktion
beta      = 0.8                                                     # gewünschter Powerfunktionswert
i         = 1                                                       # Indexinitialisierung
n_min     = NaN                                                     # minimales n Initialisierung
while(pi_n[i] < beta){                                              # Solange \pi(\delta*,n) < \beta
    n_min = n[i]                                                    # Aufnahme des minimal nötigen n
    i     = i + 1                                                   # und Erhöhung des Indexes
}
cat("minimal nötiges n =", ceiling(n_min))                          # Ausgabe
```

```{r, echo = F, eval = F}
dev.new()
graphics.off()
par(
    family      = "sans",
    mfcol       = c(1,1),
    pty         = "m",
    bty         = "l",
    lwd         = 1,
    las         = 1,
    xaxs        = "i",
    yaxs        = "i",
    font.main   = 1,
    cex         = 1.2,
    cex.main    = 1.2)

# Visualisierung
plot(n, pi_n,
    type        = "l",
    lwd         = 2,
    ylab        = " ",
    ylim        = c(0,1),
    xlab        = TeX("$n$"),
    main        = TeX("$\\pi(\\delta = 3,n)\\, für \\,\\alpha_0 = 0.05,\\, \\mu_0 = 0"))
lines(2, beta,
    type        = "p",
    pch         = 16,
    xpd         = TRUE)
lines(n_min, 0,
    type        = "p",
    pch         = 16,
    xpd         = TRUE)
arrows(
    x0          = min(n),
    y0          = beta,
    x1          = n_min,
    y1          = beta,
    col         = "darkorange",
    angle       = 20,
    length      = .1)
arrows(
    x0          = n_min,
    y0          = beta,
    x1          = n_min,
    y1          = 0,
    col         = "darkorange",
    angle       = 20,
    length      = .1)
text(3 , 0.85, TeX("$b$"),      xpd = TRUE, cex = 1.2)
text(20, 0.05, TeX("$n_{opt}"), xpd = TRUE, cex = 1.2)

# Speichern
dev.copy2pdf(
    file        = "Abbildungen/t_test_ungerichtet_stichprobengroesse.pdf",
    width       = 6,
    height      = 5)
```

```{r, echo = F, out.width = "65%", fig.align = "center"}
knitr::include_graphics("Abbildungen/t_test_ungerichtet_stichprobengroesse.pdf")
```


<!-- Abschnitt 5: Anwendung/Praxis -->
#

\large
\setstretch{2}
\vfill

Anwendungsszenario

Modellformulierung

Modellschätzung

Modellevaluation

**Anwendung/Praxis**

Selbstkontrollfragen

\vfill


<!-- Anwendungsszenario -->
# Anwendung/Praxis {.t}

\vspace{2mm}
\textcolor{darkblue}{Anwendungsbeispiel}

```{r, echo = F, out.width = "90%", fig.align = "center"}
knitr::include_graphics("Abbildungen/beispielstudie_einstichproben-t-test.pdf")
```

\small
Wir nehmen an, dass die Datenpunkte unabhängige und identisch verteilte (u.i.v.) Realisierungen von ZVen $y_i \sim N(\mu,\sigma^2)$ sind und nehmen weiter an, dass wir sind an der Quantifizierung der Unsicherheit beim inferentiellen Vergleich des wahren, aber unbekannten Erwartungswertparameters $\mu$ im Sinne eines Hypothesentests interessiert sind.


<!-- Anwendungsszenario -->
# Anwendung/Praxis

\small
\vspace{2mm}
\textcolor{darkblue}{Daten einlesen}

\tiny
\setstretch{0.5}

\vspace{1mm}
```{r, echo = T}
fname       = "Daten/T-Tests_Daten.csv"
D           = read.table(fname, sep = ",", header = TRUE)
```

\vspace{-1mm}
```{r, echo = F}
knitr::kable(D[c(1:40),],
             align = "cccccr",
             "pipe")
```


<!-- Anwendungsszenario -->
# Anwendung/Praxis

\vspace{1mm}

\tiny
\setstretch{0.8}

```{r, echo = T, eval = F}
# Datensatz von Interesse
BDI_F2F     = D$dBDI[D$Setting == "F2F"]        # BDI-Differenzwerte in der F2F-Gruppe

# Histogrammparameter
h           = 1                                 # gewünschte Klassenbreite
b_0         = min(BDI_F2F)                      # b_0
b_k         = max(BDI_F2F)                      # b_k
k           = ceiling((b_k - b_0)/h)            # Anzahl der Klassen
b           = seq(b_0, b_k, by = h)             # Klassen [b_0, ..., b_k]
ylimits     = c(0,0.15)                         # y-Achsenlimits
xlimits     = c(-5,15)                          # x-Achsenlimits

# Abbildungsparameter
par(                                            # für Details siehe ?par
    mfcol       = c(1,1),                       # 1 x 1 Panelstruktur
    family      = "sans",                       # Serif-freier Fonttyp
    pty         = "s",                          # quadratische Abbildungsregion
    bty         = "l",                          # L-förmige Box
    las         = 1,                            # horizontale Achsenbeschriftung
    xaxs        = "i",                          # x-Achse bei y = 0
    yaxs        = "i",                          # y-Achse bei x = 0
    font.main   = 1,                            # Titel nicht fett
    cex         = 1,                            # Textvergrößerungsfaktor
    cex.main    = 1)                            # Titeltextvergrößerungsfaktor

# Histogramm
hist(BDI_F2F,                                   # Delta-BDI_Werte von Therapiebedingung i
    breaks    = b,                              # Histogrammklassen
    freq      = F,                              # normierte relative Häufigkeit
    xlim      = xlimits,                        # x-Achsenlimits
    ylim      = ylimits,                        # y-Achsenlimits
    xlab      = TeX("$\\Delta BDI$"),           # x-Achsenbeschriftung
    ylab      = "geschätzte Wahrscheinlichkeit",# y-Achsenbeschriftung
    main      = "")                             # Titelbeschriftung

# Speichern
dev.copy2pdf(
    file      = "Abbildungen/F2F_histogramm.pdf",
    width     = 4,
    height    = 4)
```


<!-- Anwendungsszenario -->
# Anwendung/Praxis

\vspace{2mm}

\tiny
\setstretch{1}

```{r, echo = T, eval = T}
# Einlesen der Daten
fname         = "Daten/T-Tests_Daten.csv"
D             = read.table(fname, sep = ",", header = TRUE)

# Initialisierung eines Dataframes
tp            = c("F2F")                            # Therapiebedingungen
ntp           = length(tp)                          # Anzahl Therapiebedingungen
S             = data.frame(                         # Dataframe-Erzeugung
                    n         = rep(NaN,ntp),       # Stichprobengrößen
                    Max       = rep(NaN,ntp),       # Maxima
                    Min       = rep(NaN,ntp),       # Minima
                    Median    = rep(NaN,ntp),       # Mediane
                    Mean      = rep(NaN,ntp),       # Mittelwerte
                    Var       = rep(NaN,ntp),       # Varianzen
                    Std       = rep(NaN,ntp),       # Standardabweichungen
                    row.names = tp)                 # Therapiebedingungen

# Iterationen über Therapiebedingungen
for(i in 1:ntp){
    data        = D$dBDI[D$Setting == tp[i]]        # Daten
    S$n[i]      = length(data)                      # Stichprobengröße
    S$Max[i]    = max(data)                         # Maxima
    S$Min[i]    = min(data)                         # Minima
    S$Median[i] = median(data)                      # Mediane
    S$Mean[i]   = mean(data)                        # Mittelwerte
    S$Var[i]    = var(data)                         # Varianzen
    S$Std[i]    = sd(data)                          # Standardabweichungen
}
```


<!-- Anwendungsszenario -->
# Anwendung/Praxis

\vspace{2mm}

\small
\textcolor{darkblue}{Deskriptive Statistiken der negativen PostBDI-PreBDI-Differenzen bei Face-to-Face-Therapie}

```{r, echo = F, out.width = "50%", fig.align = "center"}
knitr::include_graphics("Abbildungen/F2F_histogramm.pdf")
```

\footnotesize
\setstretch{1}
```{r, echo = T}
# Ausgabe
print.AsIs(S)
```


<!-- Datenanalyse -->
# Anwendung/Praxis

\vspace{2mm}

\tiny
\setstretch{0.8}
```{r, echo = T}
# Daten einlesen
fname       = "Daten/T-Tests_Daten.csv"                            # Dateiname
D           = read.table(fname, sep = ",", header = TRUE)          # Dataframe
y           = D$dBDI[D$Setting == "F2F"]                           # BDI-Differenzwerte in der F2F-Gruppe

# Modellformulierung
n          = length(y)                                             # Anzahl Datenpunkte
p          = 1                                                     # Anzahl Betaparameter
X          = matrix(rep(1,n), nrow = n)                            # n x p Designmatrix

# Parameterschätzung
beta_hat   = solve(t(X) %*% X) %*% t(X) %*% y                      # Betaparameterschätzer
eps_hat    = y - X %*% beta_hat                                    # Residuenvektor
sigsqr_hat = (t(eps_hat) %*% eps_hat) /(n-p)                       # Varianzparameterschätzer

# Konfidenzintervall
delta      = 0.95                                                  # Konfidenzbedingung
t_delta    = qt((1+delta)/2,n-1)                                   # \Psi^{-1}((1+\delta)/2; n-1)
lambda     = diag(solve(t(X) %*% X))                               # \lambda_j Werte
kappa      = matrix(rep(NaN,p*2), nrow = p)                        # \beta_j Konfidenintervall-Array
for(j in 1:p){                                                     # Iteration über \beta_j
    kappa[j,1] = beta_hat[j]-sqrt(sigsqr_hat*lambda[j])*t_delta    # untere KI-Grenze
    kappa[j,2] = beta_hat[j]+sqrt(sigsqr_hat*lambda[j])*t_delta    # obere  KI-Grenze
}

# Hypothesentest
c          = matrix(c(1),nrow = p)                                 # Kontrastgewichtsvektor
mu_0       = 0                                                     # Nullhypothese
alpha_0    = 0.05                                                  # Signifikanzniveau
k_alpha_0  = qt(1 - (alpha_0/2), n-1)                              # kritischer Wert
t_num      = t(c) %*% beta_hat - mu_0                              # T-Teststatistik-Zähler
t_den      = sqrt(sigsqr_hat %*% t(c)*solve(t(X) %*% X)%*%c)       # T-Teststatistik-Nenner
t          = t_num/t_den                                           # T-Teststatistik
if(abs(t) >= k_alpha_0){phi = 1} else {phi = 0}                    # Test 1_{|T(X) >= k_alpha_0|}
pval       = 2*(1 - pt(abs(t), n-1))                               # p-Wert
d          = t/sqrt(n)                                             # Cohen's d 
```

\vspace{-1mm}
```{r, echo = F}
cat(  "fg        = ", n-1,
    "\nkappa_1   = ", kappa,
    "\nt         = ", t,
    "\nalpha_0   = ", alpha_0,
    "\nk_alpha_0 = ", k_alpha_0,
    "\nphi       = ", phi,
    "\np-Wert    = ", pval,
    "\nCohen's d = ", d)
```


<!-- Datenanalyse -->
# Anwendung/Praxis

\small
\textcolor{darkblue}{Anwendungszenario}

\vspace{2mm}

\tiny
\setstretch{1.2}
```{r, echo = T}
# automatischer Einstichproben-T-Test
varphi = t.test(y,                             # Datensatz
             alternative = c("two.sided"),     # H_1: \mu \neq \mu_0
             mu          = 0,                  # \mu_0 (sic!)
             conf.level  = 1-alpha_0)          # \delta = 1 - \alpha_0

# Ausgabe
print(varphi)

# genauere Ausgabe von t
paste(varphi[1]$statistic)

# genauere Ausgabe von p
paste(varphi[3]$p.value)
```


<!-- Datensatz: Great 10k -->
# Anwendung/Praxis

\small
Datensatz: Zielzeiten beim Great 10k (08.10.2017), getrennt nach Altersklasse ($n = 4883$)

```{r, echo = F, eval = T}
# Daten einlesen
filename = "Daten/great_10k.csv"
D        = read.csv(filename)

# Daten reduzieren
excl     = c("FU14", "FU16", "FU18", "FU20", "FU23", "F70", "F75", "F80", "MU14", "MU16", "MU18", "MU20", "MU23", "M70", "M75", "M80")
incl     = c("FE", "FH", "F30", "F35", "F40", "F45", "F50", "F55", "F60", "F65", "ME", "MH", "M30", "M35", "M40", "M45", "M50", "M55", "M60", "M65")
D        = D[!(D$AgeGroup %in% excl),]
D        = D[!(D$X5kTime  == "NaN:NaN:NaN"),]
D        = D[!(D$X10kTime == "NaN:NaN:NaN"),]
n        = nrow(D)

# Daten umsortieren
D$AgeGroup = factor(D$AgeGroup, levels = incl)

# Daten umrechnen
t5_hms   = D$X5kTime
t5_min   = rep(0, n)
t10_hms  = D$X10kTime
t10_min  = rep(0, n)
for(i in 1:n){
    t5         = t5_hms[i]
    t10        = t10_hms[i]
    t5_min[i]  = as.numeric(substr(t5,1,2))*60  + as.numeric(substr(t5,4,5))  + as.numeric(substr(t5,7,8))/60
    t10_min[i] = as.numeric(substr(t10,1,2))*60 + as.numeric(substr(t10,4,5)) + as.numeric(substr(t10,7,8))/60
}
D$T5k1   = t5_min
D$T5k2   = t10_min-t5_min
D$T10k   = t10_min
D$Tdiff  = D$T5k2 - D$T5k1
```

```{r, echo = F, eval = F}
# Daten visualisieren
library(vioplot)
par(
    family      = "sans",
    mar         = c(3,3,1,1),
    pty         = "m",
    bty         = "l",
    lwd         = 1,
    las         = 1,
    mgp         = c(2,1,0),
    xaxs        = "i",
    yaxs        = "i",
    font.main   = 1.5,
    cex         = 1.5)

# Violinplot
vioplot(D$T10k ~ D$AgeGroup, D,
    col         = "gray80",
    rectCol     = "black",
    lineCol     = "white",
    colMed      = "black",
    border      = "black",
    pchMed      = 16,
    plotCentre  = "lines",
    xlab        = "Altersklasse",
    ylab        = "Zielzeit [min]",
    ylim        = c(25,85),
    drawRect    = FALSE)

# Datenpunkte
stripchart(D$T10k ~ D$AgeGroup, D,
    method      = "jitter",
    xaxt        = "n",
    vertical    = TRUE,
    pch         = 19,
    col         = "black",
    add         = TRUE,
    cex         = 0.4)

# Mittelwerte
dx = 0.3
for (i in 1:length(incl)) {
    segments(
        x0      = i - dx,
        x1      = i + dx,
        y0      = median(D$T10k[D$AgeGroup==incl[i]]),
        y1      = median(D$T10k[D$AgeGroup==incl[i]]),
        col     = "black",
        lwd     = 2)
}

# Speichern
dev.copy2pdf(
    file        = "Abbildungen/great_10k_violin_plot.pdf",
    width       = 16,
    height      = 9)
```

\vspace{2mm}
```{r, echo = F, out.width = "100%"}
knitr::include_graphics("Abbildungen/great_10k_violin_plot.pdf")
```


<!-- Einstichproben-T-Test (falsch) -->
# Anwendung/Praxis

\small
Einstichproben-T-Test: 10-km-Zeit, alle Teilnehmer ($n = 4883$)

\vspace{2mm}
```{r, echo = T, eval = T}
# Daten extrahieren
D$T10k = t10_min                                            # 10-km-Zeit [min]

# Einstichproben-T-Test (falsch)
n      = nrow(D)                                            # Anzahl Datenpunkte
p      = 1                                                  # Anzahl Regressoren
y      = matrix(D$T10k, nrow = n)                           # Datenvektor
X      = matrix(rep(1,n), ncol = p)                         # Designmatrix
```

```{r, echo = F, eval = T}
# Einstichproben-T-Test (falsch)
b_hat  = solve(t(X) %*% X) %*% t(X) %*% y                   # Betaparameterschätzer
e_hat  = y - X %*% b_hat                                    # Residuenvektor
s2_hat = (t(e_hat) %*% e_hat)/(n-p)                         # Varianzparameterschätzer
c      = matrix(c(1), nrow = p)                             # Kontrastvektor
cTb0   = 0                                                  # Nullhypothese
t      = (t(c)%*%b_hat - cTb0)/sqrt(s2_hat * t(c)%*%solve(t(X) %*% X)%*%c)  # T-Statistik
d      = t/sqrt(n)                                          # Cohen's d 
pval   = 2*(1 - pt(abs(t), n-1))                            # p-Wert
cat(  "Betaparameterschätzer          : ", round(b_hat,  digits = 3),
    "\nVarianzparameterschätzer       : ", round(s2_hat, digits = 3),
    "\nEinstichproben-T-Teststatistik : ", round(t,      digits = 3),
    "\nCohen's  d                     : ", round(d,      digits = 3),
    "\np-Wert                         : ", round(pval,   digits = 3), "\n\n")
```


<!-- Datensatz: Great 10k -->
# Anwendung/Praxis

\small
Datensatz: erste vs. zweite 5 km beim Great 10k (08.10.2017), alle Teilnehmer ($n = 4883$)

```{r, echo = F, eval = F}
# Daten visualisieren
par(
    family      = "sans",
    mar         = c(3,3,1,1),
    pty         = "s",
    bty         = "l",
    lwd         = 1,
    las         = 1,
    mgp         = c(2,1,0),
    xaxs        = "i",
    yaxs        = "i",
    font.main   = 1.5,
    cex         = 1.5)

# Streudiagramm
plot(D$T5k1, D$T5k2,
    pch         = 16,
    xlab        = "erste 5 km [min]",
    ylab        = "zweite 5 km [min]",
    xlim        = c(10, 50),
    ylim        = c(10, 50))

# Liniendiagramm
abline(
    coef        = c(0, 1),
    lty         = 1,
    lwd         = 4,
    col         = "gray80")

# Speichern
dev.copy2pdf(
    file        = "Abbildungen/great_10k_streudiagramm.pdf",
    width       = 9,
    height      = 9)
```

\vspace{2mm}
```{r, echo = F, out.width = "60%", fig.align = "center"}
knitr::include_graphics("Abbildungen/great_10k_streudiagramm.pdf")
```


<!-- Einstichproben-T-Test (richtig) -->
# Anwendung/Praxis

\small
Einstichproben-T-Test: Differenz zweite minus erste 5 km, alle Teilnehmer ($n = 4883$)

\vspace{2mm}
```{r, echo = T, eval = T}
# Daten extrahieren
D$T5k1 = t5_min                                             # erste  5 km [min]
D$T5k2 = t10_min-t5_min                                     # zweite 5 km [min]
D$Tdiff= D$T5k2 - D$T5k1                                    # Differenz [min]

# Einstichproben-T-Test (richtig)
n      = nrow(D)                                            # Anzahl Datenpunkte
p      = 1                                                  # Anzahl Regressoren
y      = matrix(D$Tdiff, nrow = n)                          # Datenvektor
X      = matrix(rep(1,n), ncol = p)                         # Designmatrix
```

```{r, echo = F, eval = T}
# Einstichproben-T-Test (richtig)
b_hat  = solve(t(X) %*% X) %*% t(X) %*% y                   # Betaparameterschätzer
e_hat  = y - X %*% b_hat                                    # Residuenvektor
s2_hat = (t(e_hat) %*% e_hat)/(n-p)                         # Varianzparameterschätzer
c      = matrix(c(1), nrow = p)                             # Kontrastvektor
cTb0   = 0                                                  # Nullhypothese
t      = (t(c)%*%b_hat - cTb0)/sqrt(s2_hat * t(c)%*%solve(t(X) %*% X)%*%c)  # T-Statistik
d      = t/sqrt(n)                                          # Cohen's d 
pval   = 2*(1 - pt(abs(t), n-1))                            # p-Wert
cat(  "Betaparameterschätzer          : ", round(b_hat,  digits = 3),
    "\nVarianzparameterschätzer       : ", round(s2_hat, digits = 3),
    "\nEinstichproben-T-Teststatistik : ", round(t,      digits = 3),
    "\nCohen's d                      : ", round(d,      digits = 3),
    "\np-Wert                         : ", round(pval,   digits = 3), "\n\n")
```


<!-- Anhang: Selbstkontrollfragen -->
#

\large
\setstretch{2}
\vfill

Anwendungsszenario

Modellformulierung

Modellschätzung

Modellevaluation

Anwendung/Praxis

**Selbstkontrollfragen**

\vfill


<!-- Selbstkontrollfragen -->
# Selbstkontrollfragen

\footnotesize
\setstretch{1.2}
\begin{enumerate}

\item Erläutern Sie die Extremszenarien im Kontinuum von ALM-Designs.
\item Erläutern Sie die Begriffe der faktoriellen und parametrischen ALM-Designs.
\item Nennen Sie Beispiele für faktorielle, parametrische und faktoriell-parametrische ALM-Designs.
\item Erläutern Sie das Anwendungsszenario eines Einstichproben-T-Tests.
\item Erläutern Sie mögliche Hypothesenszenarien eines Einstichproben-T-Tests.
\item Geben Sie die Definition des Einstichproben-T-Test-Modells wieder.
\item Geben Sie das Theorem zur Parameterschätzung im Einstichproben-T-Test-Modell wieder.
\item Geben Sie das Theorem zur T-Teststatistik des Einstichproben-T-Tests wieder.
\item Geben Sie die Definition des zweiseitigen Einstichproben-T-Tests (mit ungerichteter Hypothese) wieder.
\item Skizzieren Sie die Testgütefunktion des zweiseitigen Einstichproben-T-Tests.
\item Geben Sie das Theorem zur Testumfangkontrolle im zweiseitigen Level-$\alpha_0$-Einstichproben-T-Test wieder.
\item Erläutern Sie das praktische Vorgehen bei Durchführung eines zweiseitigen Level-$\alpha_0$-Einstichproben-T-Tests.
\item Geben Sie die Definition des p-Wertes Werts für einen zweiseitigen Einstichproben-T-Test wieder.
\item Von welchen Werten hängt die Powerfunktion eines zweiseitigen Einstichproben-T-Tests ab?
\item Skizzieren Sie die Powerfunktion des Einstichproben-T-Tests bei fester Stichprobengröße.
\item Skizzieren Sie die Powerfunktion des Einstichproben-T-Tests bei festem Nichtzentralitätsparameter.

\end{enumerate}