Modellgüte Archive

-2LL

von Dr. Magdalene Ortmann | Juni 4, 2021

-2LL ist die Log-Likelihood multipliziert mit Minus 2. Der Term -2LL wird innerhalb der logistischen Regression verwendet und bezeichnet die Devianz des Modells DM. Die Devianz ist ein Maß der Modellgüte im negativen Sinn: Eine höhere Devianz beschreibt einen schlechteren Fit des Modells an die Daten.

Adjustiertes R-Quadrat

von Dr. Magdalene Ortmann | Juni 4, 2021

Das adjustierte R² ist ein Maß der Modellgüte und wird häufig im Kontext der multiplen linearen Regression verwendet (also einer linearen Regression mit einer abhängigen Variable, aber mehr als einem Prädiktor). Es gibt, ähnlich dem Determinationskoeffizienten R², Aufschluss über den durch das Modell aufgeklärten Anteil der Varianz der abhängigen Variable.

Im Vergleich zum „normalen R^2“geht beim adjustierten R² zusätzlich die Anzahl der Prädiktoren des Modells bzw. die Modellkomplexität in die Berechnung ein, um dem Effekt des Overfittings entgegenzuwirken.

Overfitting bedeutet, dass das R² mit steigender Anzahl von Prädiktoren ebenfalls immer weiter ansteigt, obwohl die Güte des Modells nicht wirklich zunimmt. Hier entsteht also der Eindruck, dass das Modell durch die Aufnahme von immer mehr Prädiktoren stetig besser wird, was allerdings nicht unbedingt stimmt.

Falls dich der Vergleich verschiedener Adjustierungsmöglichkeiten des R²interessiert, findest du hier einen tollen Artikel dazu.

AIC (Akaikes Informationskriterium)

von Dr. Magdalene Ortmann | Juni 4, 2021

Das AIC ist ein Maß der Modellgüte, das eine höhere Modellkomplexität „bestraft“ (bzw. korrigiert). Diese Korrektur fällt mit wachsender Stichprobengröße geringer aus.

Es ist nicht wie das adjustierte R-Quadrat im Sinne aufgeklärter Varianz interpretierbar, lässt aber ebenfalls den Vergleich zwischen verschiedenen Modellen zu.

Das AIC wird deshalb (neben dem R2 oder BIC) als Kriterium für die Modellselektion verwendet. Ein geringerer Wert beschreibt einen besseren Datenfit des Modells.

BIC (Schwarz´s Bayesianisches Informationskriterium)

von Dr. Magdalene Ortmann | Juni 4, 2021

Der BIC ist ein Maß der Modellgüte. Je besser das Modell ist (d. h. je besser das Modell die Daten erklären kann), desto geringer wird er.

Anders als zum Beispiel das multiple R² bestraft der BIC jedoch für wachsende Modellkomplexität. Das bedeutet, dass der BIC größer wird, je mehr Prädiktoren im Modell enthalten sind. Je komplexer das Modell ist, desto höher ist nämlich die Gefahr von Overfitting, also die Auswahl eines Modells, welches die Daten gut zu erklären scheint, aber in Wahrheit unbrauchbar ist.

Der BIC wird also kleiner, je besser die Prädiktoren sind und umso weniger Prädiktoren es gibt. Bei der Hinzunahme von mehr Prädiktoren sinkt BIC also nur so lange, wie ein Prädiktor „mehr bringt als er kostet“. Auf diese Art und Weise probiert der BIC Underfitting (= die Aufnahme zu weniger Prädiktoren) und Overfitting (= die Aufnahme zu vieler Prädiktoren; siehe auch: Underfitting, Overfitting) zu vermeiden und das beste Modell auszuwählen.

Das beste Modell ist also das Modell, mit dem geringsten BIC. Manchmal haben mehrere Modelle einen sehr ähnlichen BIC und es ist nicht klar, welches das Beste ist. Dann ist es sinnvoll, das klinisch relevanteste Modell auszuwählen. Das klinisch relevanteste Modell ist immer jenes mit den meisten signifikanten Prädiktoren.

Übrigens: Es gibt auch noch andere mit dem BIC vergleichbare Maße, zum Beispiel das AIC (Akaikes Informationskriterium). Der BIC ist im direkten Vergleich etwas konservativer als das AIC, wählt also tendenziell weniger Prädiktoren aus.

Es sollte v. a. dann verwendet werden, wenn die Stichprobengröße groß und die Anzahl der Prädiktoren gering ist. Es ist nicht wie das (adjustierte) R² im Sinne aufgeklärter Varianz interpretierbar, lässt aber ebenfalls den Vergleich zwischen verschiedenen Modellen zu. Ein geringerer Wert beschreibt einen besseren Fit des Modells an die Daten.

Chi-Quadrat-Verteilung

von Dr. Magdalene Ortmann | Juni 4, 2021

Die Chi²-Verteilung ist eine stetige Wahrscheinlichkeitsverteilung, die in der Inferenzstatistik häufig genutzt wird, z. B. beim Test auf Unabhängigkeit kategorialer Variablen (siehe auch Chi-Quadrat-Test) oder bei der Einschätzung des fits eines Modells, also der Modellgüte.

Genau genommen gibt es nicht nur eine, sondern ziemlich viele Chi²-Verteilungen, die jeweils durch eine bestimmte Anzahl von Freiheitsgraden (degrees of freedom, kurz df) spezifiziert sind (keine Sorge, was Freiheitsgrade genau sind, musst du nicht wissen).

Diese Freiheitsgrade werden bei der Durchführung von entsprechenden Tests in SPSS oder R auch immer mit ausgegeben und sollten zur besseren Nachvollziehbarkeit beim Bericht über einen solchen Test auch immer mit angegeben werden.

-2LL

Adjustiertes R-Quadrat

AIC (Akaikes Informationskriterium)

BIC (Schwarz´s Bayesianisches Informationskriterium)

Chi-Quadrat-Verteilung

Themenreihen

Glossar Kategorien

Lade dir hier die Formelsammlung für deinen Bland-Altman-Plot herunter

You have Successfully Subscribed!

10 % Rabatt auf unsereWorkshops & Kurse im Onlineshop!

Trage dich hier für Dr. Ortmanns beste Maildizin ein und erhalte regelmäßige Rabatte, Tipps und Coachinginhalte für deine empirische Promotion

You have Successfully Subscribed!

Lade dir hier die Checkliste für deinen Methodenteil herunter

You have Successfully Subscribed!

Jetzt 10 % Rabatt auf alle

Workshops & Kurse sichern!

You have Successfully Subscribed!

Downloade dir hier das Flowchart für deine ANOVA

You have Successfully Subscribed!

Lade dir hier die Vorlage für den Aufbau deines Datensatzes herunter

You have Successfully Subscribed!