von Magdalene Ortmann | Jun 1, 2020 | Lineare Regression
Der adjustierte vorhergesagt Mittelwert dient der Messung des Einflusses eines spezifischen Datenpunktes. Stell dir vor, innerhalb eines Modells wird ein Wert für die Outcome-Variable des Modells vorhergesagt. Dies geschieht zweimal: Einmal mit (ursprünglicher vorhergesagter Wert) und einmal ohne den zu untersuchenden Datenpunkt (adjustierter vorhergesagter Wert). Die Differenz aus den zwei vorhergesagten Werten der Outcomevariable nennt man DFFit. Je größer DFFit ist, desto größer ist der Einfluss des untersuchten Datenpunktes und desto instabiler, als durch Einzelfälle beeinflussbarer ist das Modell. Findet im Rahmen der linearen Regression Anwendung.
von Magdalene Ortmann | Jun 1, 2020 | Lineare Regression, Modellgüte
Das adjustierte R2 zeigt an, wie viel Varianz in der Gesamtpopulation, aus der die untersuchte Stichprobe gezogen wurde, durch das Modell erklärt wird. Je besser das berechnete Modell ist, desto kleiner ist der Unterschied zwischen R2 (Stichprobe) und adjustiertem R2 (Gesamtpopulation). Das adjustierte R2 wird deshalb (neben dem AIC oder BIC) als Kriterium für die Modellselektion verwendet.
von Magdalene Ortmann | Jun 1, 2020 | Lineare Regression
Autokorrelation tritt dann auf, wenn die Residuen zweier Beobachtungen innerhalb eines linearen Regressionsmodells miteinander korrelieren (und somit abhängig voneinander) sind.
Siehe auch Durbin-Watson Test für genauere Informationen.
Autokorrelation ist auch im Rahmen der Zeitreihenanalyse von Bedeutung. Da dieses Glossar aber auf Medizinstatistik spezialisiert ist, wird nicht näher auf diesen Aspekt eingegangen.
von Magdalene Ortmann | Jun 10, 2020 | Korrelation, Lineare Regression
Der Determinationskoeffizient (auch R2genannt) beschreibt den Anteil der Varianz einer abhängigen Variablen, der durch eine einzige unabhängige Variable erklärt wird. Er entspricht im Falle eines Korrelationstests dem Quadrat der Produkt-Moment Korrelation nach Pearson.
Im Falle mehrerer unabhängiger Variablen (Prädiktoren), wird der multiple Determinationskoeffizient verwendet: Er beschreibt den Anteil der Varianz einer abhängigen Variable, der (z. B. in Regressionsmodellen) durch die Gesamtzahl der unabhängigen Variablen erklärt werden kann.
Das R2 steigt dabei durch die Hinzunahme weiterer Prädiktoren unweigerlich an, auch wenn die Prädiktoren auf Populationsebene nicht mit der abhängigen Variable zusammenhängen. Deshalb wird zur Modellselektion häufig das adjustierte R2, das AIC oder das BIC verwendet.
von Magdalene Ortmann | Jun 2, 2020 | Lineare Regression
Das standardisiertes Regressionsgewicht βi beschreibt die vorhergesagte Änderung im Kriterium bei einer Veränderung des Prädiktors im Rahmen der linearen Regression. Als Einheit für Prädiktor und Kriterium dient anders als beim unstandardisierten Regressionsgewicht nicht die gemessene Einheit von Prädiktor und Kriterium, sondern die Standardabweichung:
Wenn der Prädiktor um eine Standardabweichung erhöht wird und alle anderen Prädiktoren im Modell konstant gehalten werden (im Falle einer Moderation: wenn alle anderen Prädiktoren 0 sind), verändert sich das Kriterium um βi-Standardabweichungen. Das standardisiertes Regressionsgewicht βi beschreibt also die standardisierte Stärke des Zusammenhangs zwischen Prädiktor und Kriterium innerhalb der linearen Regression.
Der besondere Vorteil des standardisierten Regressionsgewichts ist die Vergleichbarkeit der jeweiligen Beziehungsstärken zwischen Prädiktoren und dem Kriterium, da die Einheiten der Prädiktoren und des Kriteriums durch die Standardisierung keine Rolle mehr spielen.
Beispiel:
β = – 0.238
Prädiktor = Körpergewicht in kg
Kriterium = Alter bei erstmaligen Herzinfarkt
Interpretation: Steigt das Körpergewicht um eine Standardabweichung, dann fällt das Alter beim erstmaligen Herzinfarkt um 0.238 Standardabweichungen.
Wichtig: Eine positives βi geht also mit einer Erhöhung des Kriteriums einher, ein negatives βi mit einer Verringerung.