
_Statistik
TH Deggendorf
28.02.2024
Verfahren für Häufigkeitsdaten (meist auf nominalem Skalenniveau)
Forschungshypothese H1: Die beiden Variablen sind abhängig (= nicht unabhängig).
Teststatistik:
mit
n\(_{ij}\): Tatsächliche Anzahl Fälle in Kategorie ij
E\(_{ij}\): Erwartete Fälle in Kategorie ij
\(k, m\): Anzahl Zeilen bzw. Spalten
n: Gesamte Anzahl
Berechnung der Erwartungen E\(_{ij}\)
mit
n\(_{•j}\): Summe Anzahl über alle Zeilen
n\(_{i•}\): Summe Anzahl über alle Spalten
\(\chi²\)-Verteilung

Beispiel Kreuztabelle
| NR | R | ||
|---|---|---|---|
| w | 90 | 10 | 100 |
| m | 80 | 20 | 100 |
| 170 | 30 | 200 |
Freiheitsgrade: \(\textit{df} = (m - 1)(k - 1)\)
Vierfeldertest: \(\textit{df} = (2-1)(2-1) = 1\)
Entscheidung:
Effektstärke: Cramer’s V
\(V = \sqrt{\frac{\chi²}{n(k - 1)}}\),
mit k = min(Kategorienzahl)
\(\chi²\)-Verteilung

| df | Kritische_Werte |
|---|---|
| 1 | 3.841459 |
| 2 | 5.991465 |
| 3 | 7.814728 |
| 4 | 9.487729 |
| 5 | 11.070498 |
| 6 | 12.591587 |
| 7 | 14.067140 |
| 8 | 15.507313 |
| 9 | 16.918978 |
| 10 | 18.307038 |
| 11 | 19.675138 |
| 12 | 21.026070 |
| 13 | 22.362033 |
| 14 | 23.684791 |
| 15 | 24.995790 |
| 16 | 26.296228 |
| 17 | 27.587112 |
| 18 | 28.869299 |
| 19 | 30.143527 |
| 20 | 31.410433 |
| 21 | 32.670573 |
| 22 | 33.924439 |
| 23 | 35.172462 |
| 24 | 36.415028 |
| 25 | 37.652484 |
| 26 | 38.885139 |
| 27 | 40.113272 |
| 28 | 41.337138 |
| 29 | 42.556968 |
| 30 | 43.772972 |







Pearson's Chi-squared test
data: vierfelder
X-squared = 2.6667, df = 1, p-value = 0.1025
Cramer V
0.1155
