Die Grundlagen statistischer Tests in der Medizin: Eine leicht verständliche Erklärung von p-Wert, Effektstärke und Hypothesen
Du hast dich schon immer gefragt, warum wir eigentlich statistische Tests wie ANOVAs, t-Tests oder Regressionen rechnen?
Wäre es nicht viel einfacher die Ergebnisse deiner Studie anhand der deskriptiven Statistiken oder Grafiken zu beschreiben?
Welche Bedeutung haben p-Werte und Effektstärken im Rahmen eines statistischen Tests?
Und wozu brauchen wir Fallzahlschätzungen?
Alle diese Fragen beantworten wir dir in dieser Artikelreihe.
Du lernst außerdem:
- wie inferenzstatistische Tests prinzipiell funktionieren
- welche Annahmen ihnen zu Grunde liegen und
- wie du die 3 Ebenen eines jeden statistischen Tests systematisch interpretierst.
Ein Tipp:
Lies die einzelnen Kapitel dieses Artikels in der vorgeschlagenen Reihenfolge und springe nicht von Thema zu Thema.
In den ersten Kapiteln werden wir dir erst einmal ein paar grundlegende statistische Begriffe und die Logik des statistischen Testens erklären.
Diese Kapitel sind zwar etwas nervig, aber unbedingt notwendig für die korrekte Interpretation deiner Studienergebnisse.
Artikel in dieser Reihe
- Die Grundlagen statistischen Testens in der Medizin: Eine leicht verständliche Erklärung von p-Wert, Effektstärke und Hypothesen.
- Stichprobe oder Population? Wo ist der Unterschied?
- Null- und Alternativhypothese – die Grundlage deiner Studie
- Fehler 1. und 2. Art und die Sache mit der Wahrscheinlichkeit
- Die Testlogik und der p-Wert
- Das Problem der Stichprobengröße
- So beurteilst du deine Studienergebnisse
- Die „optimale“ Stichprobengröße? Ein Fall für die Fallzahlschätzung!
Artikel in dieser Reihe
- Die Grundlagen statistischen Testens in der Medizin: Eine leicht verständliche Erklärung von p-Wert, Effektstärke und Hypothesen.
- Stichprobe oder Population? Wo ist der Unterschied?
- Null- und Alternativhypothese – die Grundlage deiner Studie
- Fehler 1. und 2. Art und die Sache mit der Wahrscheinlichkeit
- Die Testlogik und der p-Wert
- Das Problem der Stichprobengröße
- So beurteilst du deine Studienergebnisse
- Die „optimale“ Stichprobengröße? Ein Fall für die Fallzahlschätzung!
Unser Studienbeispiel – für dich zum Mitlernen und Verstehen
Stell dir vor, du möchtest anhand eines statistischen Tests (also inferenzstatistisch) untersuchen, ob Männer in Deutschland im Schnitt häufiger pro Monat zum Arzt gehen als Frauen.
Zu diesem Zweck erhebst du nun zufällig eine Stichprobe von 50 Männern und 50 Frauen aus Deutschland (wir werden später noch genauer auf die Wahl der Stichprobengröße eingehen).
Anschließend fragst du jede Person aus deiner Stichprobe, wie oft sie pro Monat den Arzt aufsucht. Direkt danach berechnest du getrennt für Männer und Frauen den zugehörigen Mittelwert, also die durchschnittliche Anzahl der Arztbesuche pro Monat.
Diese beiden Mittelwerte bezeichnen wir im Folgenden als M1 (Mittelwert der Männer) und M2 (Mittelwert der Frauen).
Du erhältst die folgenden (natürlich total fiktiven Werte):
M1 = 3.2
M2 = 2.5
Die 50 Männer deiner Stichprobe gehen also durchschnittlich 3.2 Mal pro Monat zum Arzt, die 50 Frauen deiner Stichprobe durchschnittlich 2.5 Mal.
Oder anders formuliert:
Der Mittelwertsunterschied zwischen den Männern und Frauen deiner Stichprobe ist M1 – M2 = 0.7.
Du siehst also ganz klar: Männer haben im Mittel 0.7 Arztbesuche mehr pro Monat als Frauen.
Bingo, Hypothese bestätigt!
Oder nicht?