von Magdalene Ortmann | Jun 4, 2021
-2LL ist die Log-Likelihood multipliziert mit Minus 2. Der Term -2LL wird innerhalb der logistischen Regression verwendet und bezeichnet die Devianz des Modells DM. Die Devianz ist ein Maß der Modellgüte im negativen Sinn: Eine höhere Devianz beschreibt einen schlechteren Fit des Modells an die Daten.
von Magdalene Ortmann | Jun 4, 2021
Das adjustierte R² zeigt an, wie viel Varianz in der Gesamtpopulation (= echte Welt mit allen Menschen), aus der die untersuchte Stichprobe gezogen wurde (= deine vorliegende Stichprobe), durch das berechnete Modell erklärt wird. Je besser das berechnete Modell ist, desto kleiner ist der Unterschied zwischen R² (Stichprobe) und adjustiertem R² (Gesamtpopulation). Das adjustierte R² wird deshalb (neben dem AIC oder BIC) als Kriterium für die Modellselektion verwendet.
von Magdalene Ortmann | Jun 4, 2021
Das AIC ist ein Maß der Modellgüte, das eine höhere Modellkomplexität „bestraft“ (bzw. korrigiert). Diese Korrektur fällt mit wachsender Stichprobengröße geringer aus. Es ist nicht wie das adjustierte R-Quadrat im Sinne aufgeklärter Varianz interpretierbar, lässt aber ebenfalls den Vergleich zwischen verschiedenen Modellen zu. Das AIC wird deshalb (neben dem R2 oder BIC) als Kriterium für die Modellselektion verwendet. Ein geringerer Wert beschreibt einen besseren Datenfit des Modells.
von Magdalene Ortmann | Jun 4, 2021
Der BIC ist ein Maß der Modellgüte. Je besser das Modell ist (d. h. je besser das Modell die Daten erklären kann), desto geringer wird er. Anders als zum Beispiel das multiple R2 bestraft der BIC jedoch für wachsende Modellkomplexität. Das bedeutet, dass der BIC größer wird, je mehr Prädiktoren im Modell enthalten sind. Je komplexer das Modell ist, desto höher ist nämlich die Gefahr von Overfitting, also die Auswahl eines Modells, welches die Daten gut zu erklären scheint, aber in Wahrheit unbrauchbar ist. Der BIC wird also kleiner, je besser die Prädiktoren sind und umso weniger Prädiktoren es gibt. Bei der Hinzunahme von mehr Prädiktoren sinkt BIC also nur so lange, wie ein Prädiktor „mehr bringt als er kostet“. Auf diese Art und Weise probiert der BIC Underfitting (= die Aufnahme zu weniger Prädiktoren) und Overfitting (= die Aufnahme zu vieler Prädiktoren; siehe auch: Underfitting, Overfitting) zu vermeiden und das beste Modell auszuwählen. Das beste Modell ist also das Modell, mit dem geringsten BIC. Manchmal haben mehrere Modelle einen sehr ähnlichen BIC und es ist nicht klar, welches das Beste ist. Dann ist es sinnvoll, das klinisch relevanteste Modell auszuwählen. Das klinisch relevanteste Modell ist immer jenes mit den meisten signifikanten Prädiktoren. Übrigens: Es gibt auch noch andere mit dem BIC vergleichbare Maße, zum Beispiel das AIC (Akaikes Informationskriterium). Der BIC ist im direkten Vergleich etwas konservativer als das AIC, wählt also tendenziell weniger Prädiktoren aus.
Es sollte v. a. dann verwendet werden, wenn die Stichprobengröße groß und die Anzahl der Prädiktoren gering ist. Es ist nicht wie das (adjustierte) R² im Sinne aufgeklärter Varianz interpretierbar, lässt aber ebenfalls den Vergleich zwischen verschiedenen Modellen zu. Ein geringerer Wert beschreibt einen besseren Fit des Modells an die Daten.
von Magdalene Ortmann | Jun 4, 2021
Die Chi-Quadrat-Verteilung ist eine Wahrscheinlichkeitsverteilung, von der in der Inferenzstatistik Gebrauch gemacht wird, wenn es z. B. um das Testen von Hypothesen bzgl. kategorialer Variablen (siehe auch Chi-Quadrat-Test) oder um die Einschätzung des Fits eines Modells bzgl. der beobachteten Daten, geht.