So beurteilst du deine Studienergebnisse
So beurteilst du deine Studienergebnisse
Artikel in dieser Reihe
- Die Grundlagen statistischen Testens in der Medizin: Eine leicht verständliche Erklärung von p-Wert, Effektstärke und Hypothesen
- Stichprobe oder Population? Wo ist der Unterschied?
- Null- und Alternativhypothese – die Grundlage deiner Studie
- Fehler 1. und 2. Art und die Sache mit der Wahrscheinlichkeit
- Die Testlogik und der p-Wert
- Das Problem der Stichprobengröße
- So beurteilst du deine Studienergebnisse
- Die „optimale“ Stichprobengröße? Ein Fall für die Fallzahlschätzung!
Artikel in dieser Reihe
- Die Grundlagen statistischen Testens in der Medizin: Eine leicht verständliche Erklärung von p-Wert, Effektstärke und Hypothesen
- Stichprobe oder Population? Wo ist der Unterschied?
- Null- und Alternativhypothese – die Grundlage deiner Studie
- Fehler 1. und 2. Art und die Sache mit der Wahrscheinlichkeit
- Die Testlogik und der p-Wert
- Das Problem der Stichprobengröße
- So beurteilst du deine Studienergebnisse
- Die „optimale“ Stichprobengröße? Ein Fall für die Fallzahlschätzung!
Wenn du die Ergebnisse deiner Studie beurteilst, dann schau dir unbedingt die folgenden drei Ebenen eines jeden Effekts an:
1. (Statistische) Signifikanz
Dieser Punkt ist am leichtesten. Hier geht es nur darum, ob dein Testergebnis statistisch signifikant ist oder eben nicht, also ob p ≤ a.
2. Effektstärke
Da du weißt, dass die statistische Signifikanz von der Stichprobengröße abhängig ist, solltest du im nächsten Schritt Effektstärkemaße berechnen, um dein Ergebnis besser beurteilen zu können.
Hier kommt es nun darauf an, was für einen Test du genau durchgeführt hast, da es unterschiedliche Effektstärkemaße für unterschiedliche Verfahren gibt (und in der Regel auch mehrere Effektstärkemaße für ein Verfahren).
Für die gängigsten Verfahren sind das beispielsweise:
- Cohens d oder Hedges g für den t-Test
- der Determinationskoeffizient R² (oder das adjustierte R²) für die lineare Regression
- η²(oder das partielle η²) oder ω² für varianzanalytische Modelle
Für jedes Effektstärkemaß gib es Konventionen (!), wie deren Größe zu interpretieren ist („kleiner“, „mittlerer“ oder „großer Effekt“), die immer im statistischen Analyseteil deiner Dissertation definiert werden sollten.
Effektstärken werden weniger stark von der Stichprobengröße beeinflusst als der p-Wert und geben dir somit einen besseren Eindruck über die statistische Bedeutsamkeit deines Effekts.
Sie sollten daher zusätzlich zum p-Wert berichtet und interpretiert werden.
(Wir können hier leider nicht im Detail auf die verschiedenen Effektstärken eingehen, weil es den Inhalt dieses Artikels sprengen würden. In jedem unserer Onlinekurse berechnen wir die Effektstärken aber serienmäßig mit und erklären dir genau, wie du sie interpretieren kannst).
3. Klinische Bedeutsamkeit
Hier bist du als Mediziner und klinischer Forscher gefragt!
Nutze für diesen letzten Schritt dein gesamtes klinisches Wissen um die inhaltliche Bedeutsamkeit deines Effekts zu beurteilen.
Konzentriere dich dabei auf die deskriptive Statistik deines Effekts:
- Überlege zuerst in welcher Einheit deine untersuchten Variablen gemessen wurden. das hilft dir bei der klinischen Interpretation der Mittelwerte.
- Schaue dir dann die Mittelwerte der Gruppen unabhängig von der Mittelwertsdifferenz an – sind sie im Normbereich, erhöht oder erniedrigt? Diese Einordnung hat nicht selten einen Einfluss auf die Bedeutung der Mittelwertsdifferenz (gleiches gilt für jeden anderen Test und alle von dir erstellten deskriptiven Statistiken)
- Überlege dann: Ist z.B. die gemessene Mittelwertsdifferenz klinisch relevant, oder stellt sie keinen wichtigen Unterschied dar? (Das passiert z.B. sehr oft bei sehr großen Stichproben, die schnell zu signifikanten Testergebnissen führen.)
- Achte nicht nur auf relative (%), sondern auch auf absolute (n) Unterschiede (sofern untersucht).
Eine Reduktion der Nebenwirkung „Erbrechen“ um 50% durch das neue Studienmedikament im Vergleich zur Standardtherapie kann auf den ersten Blick sehr viel erscheinen und auch signifikant sein.
Wenn aber vorher nur 2 von 10.000 Patienten unter Einnahme des Standardmedikaments erbrochen haben, und unter dem Studienmedikament nur noch ein Patient erbricht, dann stellt sich die Frage, ob wir wirklich von einer klinischen Überlegenheit des neuen Medikaments sprechen können und ob z.B. der höhere Preis des neuen Medikaments wirklich gerechtfertigt ist….
Somit ist es als Mediziner deine Aufgabe, deine Studienergebnisse anhand aller 3 Ebenen – Signifikanz, Effektstärke UND klinische Relevanz umfassend zu beurteilen.