Der zentrale Grenzwertsatz (ZGS) ist ein für das statistische Testen wichtiger Satz, der besagt, dass mit zunehmender Stichprobengröße N die Verteilung des Stichprobenmittelwertes sich einer Normalverteilung annähert, egal wie die zugrundeliegende Variable selbst verteilt ist.

Was bedeutet das?

Stell dir vor, du bist daran interessiert, wie oft die Menschen in Deutschland pro Monat einen Arzt aufsuchen und ziehst jetzt von allen Menschen aus Deutschland sehr oft (z. B. 5000 Mal) eine Zufallstischprobe mit dem Umfang N (mit Zurücklegen).

Dabei erhebst du jedes Mal, wie oft jede der N Personen pro Monat einen Arzt aufgesucht hat und berechnest im nächsten Schritt den Mittelwert der jeweiligen Stichprobe.

Würdest du dann die Verteilung dieser 5000 Mittelwerte grafisch darstellen, dann würde diese (in etwa) einer Normalverteilung folgen.

Dabei würden die Abweichungen von der Normalverteilung umso kleiner werden, je mehr Personen in deinen gezogenen Stichproben enthalten gewesen wären. Es wäre dabei vollkommen egal, wie die Variable selbst (im Beispiel also die Anzahl monatlicher Arztbesuche) verteilt ist!

Warum ist das so wichtig?

Wie du ja weißt, wird bei vielen statistischen Verfahren vorausgesetzt, dass die relevante (abhängige) Variable normalverteilt ist. Für die Praxis besagt der ZGS nun, dass du statistische Tests, in denen letztendlich Mittelwerte miteinander verglichen werden (z. B. ANOVA, t-Test für unabhängige Stichproben), auch dann durchführen kannst, wenn nicht davon auszugehen ist, dass deine relevante Variable normalverteilt ist, da die Mittelwerte mit zunehmender Stichprobengröße N in etwa einer Normalverteilung folgen werden.

Toll, aber wie groß muss die Stichprobe denn dafür sein?

Das kann man leider so pauschal nicht beantworten, da hier mehrere Faktoren zusammenwirken (z. B. wie stark die Verteilung der Variable von einer Normalverteilung abweicht). In den meisten Lehrbüchern lässt sich allerdings die grobe Daumenregel finden, dass ab etwa N > 30 eine Verletzung der Normalverteilungsannahme keine nennenswerten Auswirkungen auf die Testergebnisse hat.

Allerdings sind Patientendaten nicht unbedingt mit denen der gesunden Normalbevölkerung vergleichbar, sondern zeigen häufig deutlich stärkere Abweichungen von der Normalverteilung. Deshalb solltest du die Grenze lieber etwas höher ansetzen oder im Zweifel ein robustes Verfahren wählen.

Lade dir hier die Formelsammlung für deinen Bland-Altman-Plot herunter

Melde dich für meinen Newsletter an und erhalte sofort das PDF!

You have Successfully Subscribed!

10 % Rabatt auf unsereWorkshops & Kurse im Onlineshop!

Trage dich hier für Dr. Ortmanns beste Maildizin ein und erhalte regelmäßige Rabatte, Tipps und Coachinginhalte für deine empirische Promotion

You have Successfully Subscribed!

Lade dir hier die Checkliste für deinen Methodenteil herunter

Melde dich für meinen Newsletter an und erhalte sofort das PDF!

You have Successfully Subscribed!


Jetzt 10 % Rabatt auf alle

Workshops & Kurse sichern!

You have Successfully Subscribed!

Downloade dir hier das Flowchart für deine ANOVA

Melde dich für meinen Newsletter an und erhalte sofort das PDF!

You have Successfully Subscribed!

Lade dir hier die Vorlage für den Aufbau deines Datensatzes herunter

Melde dich für meinen Newsletter an und erhalte sofort die Excel-Vorlage!

You have Successfully Subscribed!