Stichprobe oder Population? Wo ist der Unterschied?
Artikel in dieser Reihe
- Die Grundlagen statistischen Testens in der Medizin : Eine leicht verständliche Erklärung von p-Wert, Effektstärke und Hypothesen
- Stichprobe oder Population? Wo ist der Unterschied?
- Null- und Alternativhypothese – die Grundlage deiner Studie
- Fehler 1. und 2. Art und die Sache mit der Wahrscheinlichkeit
- Die Testlogik und der p-Wert
- Das Problem der Stichprobengröße
- So beurteilst du deine Studienergebnisse
- Die „optimale“ Stichprobengröße? Ein Fall für die Fallzahlschätzung!
Artikel in dieser Reihe
- Die Grundlagen statistischen Testens in der Medizin: Eine leicht verständliche Erklärung von p-Wert, Effektstärke und Hypothesen
- Stichprobe oder Population? Wo ist der Unterschied?
- Null- und Alternativhypothese – die Grundlage deiner Studie
- Fehler 1. und 2. Art und die Sache mit der Wahrscheinlichkeit
- Die Testlogik und der p-Wert
- Das Problem der Stichprobengröße
- So beurteilst du deine Studienergebnisse
- Die „optimale“ Stichprobengröße? Ein Fall für die Fallzahlschätzung!
Die wichtigste Unterscheidung, die man bei statistischen Tests immer im Hinterkopf haben sollte, ist die zwischen Population und Stichprobe.
Natürlich möchtest du im eben entwickelten Beispiel nicht wissen, ob die Männer deiner Stichprobe häufiger zum Arzt gehen als die Frauen deiner Stichprobe. Um diese Frage zu beantworten bräuchtest du keinen statistischen Test, sondern du kannst ja unmittelbar sehen, dass M1 größer ist als M2.
Deine Untersuchungsfrage bezieht sich also nicht auf die erhobene Stichprobe, sondern auf die zugehörige Population, aus der diese Stichprobe stammt.
Du möchtest wissen, ob Männer in Deutschland häufiger pro Monat einen Arzt aufsuchen als Frauen und gemeint ist damit, dass die Gesamtheit der Männer in Deutschland im Schnitt häufiger einen Arzt aufsucht als die Gesamtheit der Frauen in Deutschland.
Da du nun aber natürlich nicht die ganze Population (also sämtliche Männer und sämtliche Frauen aus Deutschland) untersuchen kannst, ziehst du eben zufällig aus dieser Population eine Stichprobe.
Das tust du in der Hoffnung anhand deiner Stichprobe Rückschlüsse auf die Population ziehen zu können (deshalb heißt das Ganze dann auch „Inferenzstatistik“).
Um diesen extrem wichtigen Unterschied (der auch nicht selten für Verwirrung und Ungereimtheiten in der Interpretation von Untersuchungsergebnissen sorgt) dauerhaft und sichtbar deutlich zu machen, ist es sinnvoll statistische Parameter (wie etwa den Mittelwert, die Standardabweichung oder auch die Korrelation), die sich sowohl auf die Stichprobe als auch auf die Population beziehen können, unterschiedlich zu kennzeichnen.
So kennzeichnen wir Parameter der Population und der Stichprobe:
So verwendet man für statistische Parameter, die sich auf die Stichprobe beziehen, lateinische Buchstaben wie beispielsweise M für den Mittelwert, S für die Standardabweichung oder r für die Korrelation zwischen zwei Variablen.
Meint man hingegen statistische Parameter, die sich auf die gesamte Population beziehen, dann bezeichnet man diese in der Regel mit griechischen Buchstaben wie μ für den Mittelwert der gesamten Population, σ für die Standardabweichung der gesamten Population und ρ für die Korrelation zweier Variablen innerhalb der gesamten Population.
Du kannst hier gut sehen, wie wichtig und nützlich solche unterschiedlichen Notationen sind, denn wenn man einfach nur von „Mittelwert“ oder „Standardabweichung“ reden würde, dann ist ohne Weiteres natürlich nicht klar, welches der beiden Konzepte (Stichproben- oder Populationsebene) denn nun gemeint ist!
Anhand unseres einfachen Beispiels siehst du wahrscheinlich sofort, dass:
- die beiden Stichprobenmittelwerte M1 und M2 natürlich davon abhängig sind, welche konkrete Stichprobe man gezogen hat (also welche 50 Frauen und welche 50 Männer aus der gesamten Population, denn auch bei Zufallsziehungen kann das ganz schön variieren!)
- es ziemlich wahrscheinlich ist, dass man bei einer weiteren zufällig gezogenen Stichprobe von 50 Männern und 50 Frauen ziemlich sicher andere Stichprobenmittelwerte bekommen würde (wie sehr anders weiß man natürlich nicht)
- in der Regel die erhobenen Stichprobenmittelwerte M1 und M2 nicht identisch den Mittelwerten der gesamten Population μ1 und μ2 sein werden (also den Mittelwerten von allen Männern bzw. Frauen aus Deutschland). Das folgt aus den ersten beiden Punkten.
Diese 3 Punkte werden für das weitere Verständnis wichtig sein!
Sie erklären dir auch, warum wir in verschiedenen Publikationen, die die gleiche Forschungsfrage untersuchen, abweichende Ergebnisse bekommen können.