von Dr. Magdalene Ortmann | Jun 4, 2021
Der adjustierte vorhergesagt Wert dient der Messung des Einflusses eines spezifischen Datenpunktes auf die Modellvorhersage.
Stell dir vor, innerhalb eines Modells wird ein Wert für die Outcome-Variable des Modells vorhergesagt. Dies geschieht zweimal: Einmal mit (ursprünglicher vorhergesagter Wert) und einmal ohne den zu untersuchenden Datenpunkt (adjustierter vorhergesagter Wert).
Die skalierte Differenz aus den zwei vorhergesagten Werten der Outcomevariable nennt man DFFit. Je größer DFFit ist, desto größer ist der Einfluss des untersuchten Datenpunktes und desto instabiler, also durch Einzelfälle beeinflussbarer, ist das Modell. Je stabiler ein Modell ist, desto besser ist es.
Der adjustierte vorhergesagt Wert findet im Rahmen der linearen Regression Anwendung.
von Dr. Magdalene Ortmann | Jun 4, 2021
Das adjustierte R2 ist ein Maß der Modellgüte und wird häufig im Kontext der multiplen linearen Regression verwendet (also einer linearen Regression mit einer abhängigen Variable, aber mehr als einem Prädiktor). Es gibt, ähnlich dem Determinationskoeffizienten R2, Aufschluss über den durch das Modell aufgeklärten Anteil der Varianz der abhängigen Variable.
Im Vergleich zum „normalen R2“ geht beim adjustierten R2 zusätzlich die Anzahl der Prädiktoren des Modells bzw. die Modellkomplexität in die Berechnung ein, um dem Effekt des Overfittings entgegenzuwirken.
Overfitting bedeutet, dass das R2 mit steigender Anzahl von Prädiktoren ebenfalls immer weiter ansteigt, obwohl die Güte des Modells nicht wirklich zunimmt. Hier entsteht also der Eindruck, dass das Modell durch die Aufnahme von immer mehr Prädiktoren stetig besser wird, was allerdings nicht unbedingt stimmt.
Falls dich der Vergleich verschiedener Adjustierungsmöglichkeiten des R2 interessiert, findest du hier einen tollen Artikel dazu.
von Dr. Magdalene Ortmann | Jun 4, 2021
Das AIC ist ein Maß der Modellgüte, das eine höhere Modellkomplexität „bestraft“ (bzw. korrigiert). Diese Korrektur fällt mit wachsender Stichprobengröße geringer aus.
Es ist nicht wie das adjustierte R-Quadrat im Sinne aufgeklärter Varianz interpretierbar, lässt aber ebenfalls den Vergleich zwischen verschiedenen Modellen zu.
Das AIC wird deshalb (neben dem R2 oder BIC) als Kriterium für die Modellselektion verwendet. Ein geringerer Wert beschreibt einen besseren Datenfit des Modells.
von Dr. Magdalene Ortmann | Jun 4, 2021
Autokorrelation tritt dann auf, wenn die Residuen zweier Beobachtungen innerhalb eines linearen Regressionsmodells miteinander korrelieren (und somit abhängig voneinander) sind.
Siehe auch Durbin-Watson Test für genauere Informationen.
Autokorrelation ist auch im Rahmen der Zeitreihenanalyse von Bedeutung. Da dieses Glossar aber auf Medizinstatistik spezialisiert ist, wird nicht näher auf diesen Aspekt eingegangen.
von Dr. Magdalene Ortmann | Jun 4, 2021
Den β-Fehler oder Fehler 2. Art begeht man, wenn man sich im Rahmen eines Tests für die Nullhypothese (H0) entscheidet, obwohl die Alternativhypothese (H1) gilt. Die zugehörige Wahrscheinlichkeit für diesen Fehler wird mit β bezeichnet.
Die Gegenwahrscheinlichkeit 1- β nennt man auch die Power eines Tests oder kurz die Teststärke. Die Power eines Tests gibt demzufolge an, wie hoch die Wahrscheinlichkeit ist, dass man sich für die Alternativhypothese (H1) entscheidet, wenn diese auch gilt und sollte natürlich so hoch wie möglich sein.
Im Rahmen von Poweranalysen lassen sich „optimale“ Stichprobengrößen ermitteln, so dass ein Test eine vorher festgelegte Power (und damit auch ein festes β) aufweist.
Wenn du mehr über die allgemeine Logik statistischer Tests (inklusive Poweranalysen) wissen möchtest, dann schau in unseren Grundlagenartikel zu diesem Thema.