Zentraler Grenzwertsatz

Der zentraler Grenzwertsatz besagt, dass mit zunehmender Stichprobengröße (bei wenig Ausreißern innerhalb der Stichprobe: ab N > 30) die Stichprobenkennwertverteilung des zu untersuchenden Merkmals der Normalverteilung folgt.

Das verstehst du nicht? Kein Problem:

Stell dir vor, du ziehst aus allen weltweit verfügbaren Personen 5000x eine Zufallsstichprobe der Größe N, berechnest nach dem ersten Ziehen den Mittelwert der Stichprobe, legst alle gezogenen Probanden zurück und ziehst eine weitere Stichprobe aus der Gesamtpopulation. Dann  berechnest du wieder den Mittelwert, legst die gezogene Stichprobe zurück und das weitere 4998x.

Würdest du dann alle berechneten Stichprobenmittelwerte in einem Verteilungsdiagramm plotten, würdest du die Form einer Normalverteilung erhalten – egal ob das untersuchte Merkmal innerhalb der Gesamtpopulation normalverteilt ist oder nicht, die Verteilung der berechneten Stichproben-Mittelwerte wäre es.

Dabei gelten zwei Bedingungen:

  1. Je größer das N pro gezogener Stichprobe, desto schneller wird die Normalverteilung des Stichprobenkennwertes erreicht (es sind also nicht immer 5000 Ziehungen notwendig, sondern auch weniger).
  2. Je mehr die Verteilung des initial untersuchten Merkmals innerhalb der Gesamtpopulation der Normalverteilung gleicht, desto kleiner darf die Größe der gezogenen Stichprobe sein, um eine Normalverteilung des Stichprobenkennwertes zu erhalten.

 

Der Clou an der Sache ist der: Der Mittelwert der Stichprobenkennwertverteilung ist mit sehr hoher Wahrscheinlichkeit gleich oder sehr ähnlich dem wahren Mittelwert der Gesamtpopulation.

 

Können wir daraus schließen, dass wir bei einer Stichprobe mit N > 30 automatisch von einer Normalverteilung ausgehen dürfen und mit dem Mittelwert der Stichprobe den wahren Mittelwert der Gesamtpopulation errechnen?

 

Nein, das wäre falsch!

 

Aber, was wir machen können, ist ein Verfahren namens Bootstrapping in SPSS zu aktivieren, dass ähnlich zu dem Vorgehen oben, Unterstichproben aus der von uns untersuchten Stichprobe zieht und mit Hilfe eines 95%-Konfidenzintervalls angibt, in welchem Bereich sich der wahre Mittelwert der Gesamtpopulation befindet. Je schmaler dieser Bereich ist, desto repräsentativer ist unsere Stichprobe und desto aussagekräftiger ist unsere Untersuchung.

 

 

 

Zentrierung

Die Zentrierung einer Variablen definiert eine Transformation, bei der der Mittelwert der Variablen von jedem einzelnen gemessenen Wert dieser Variablen abgezogen wird.

Hierdurch wird der Mittelwert der zentrierten Variable auf Null gesetzt, während die Standardabweichung unverändert bleibt. Die Zentrierung wird häufig in Regressionsverfahren genutzt, da hierdurch der Interzept der Prädiktoren leichter interpretiert werden kann.

Die Zentrierung ist eine Alternative zur z-Standarisierung der Prädiktoren. In Multilevel-Modellen unterscheidet man zwischen Grand Mean Centering und Group Mean Centering.

 

 

Zwischensubjektdesign

Das Zwischensubjektdesign ist der Ausdruck für statistisches Design bei dem verschiedene Studiengruppen miteinander verglichen werden, die jeweils unterschiedliche Personen enthalten.

Ein Beispiel wäre z.B. der Vergleich einer Gruppe A die Paracematol bei Kopfschmerzen erhält mit einer Gruppe B, die Ibuprofen bekommt. Jede Person erhält also entweder Paracetamol ODER Ibuprofen. Sie gehört also entweder Gruppe A ODER B an. Die Wirkung beider Therapien könnte dann anhand der mittleren Kopfschmerzstärken beider Gruppen mit Hilfe einer Visuellen Analogskala (VAS) verglichen werden.

Anwendung findet dieses statistische Design zum Beispiel im Rahmen des unabhängigen T-Tests oder der univariaten ANOVA, also bei dem statischen Vergleichs von zwei oder mehr Gruppen (siehe auch faktorielle ANOVA).

SYNONYME: Ungepaart (er T-test), Between-Subject-Design

 

 

 

Trag dich hier für Dr. Ortmanns beste Maildizin ein und erhalte regelmässige für deine empirische Promtion

You have Successfully Subscribed!