Adjustierter vorhergesagter Wert

Der adjustierte vorhergesagt Mittelwert dient der Messung des Einflusses eines spezifischen Datenpunktes. Stell dir vor, innerhalb eines Modells wird ein Wert für die Outcome-Variable des Modells vorhergesagt. Dies geschieht zweimal: Einmal mit (ursprünglicher vorhergesagter Wert) und einmal ohne den zu untersuchenden Datenpunkt (adjustierter vorhergesagter Wert). Die Differenz aus den zwei vorhergesagten Werten der Outcomevariable nennt man DFFit. Je größer DFFit ist, desto größer ist der Einfluss des untersuchten Datenpunktes und desto instabiler, als durch Einzelfälle beeinflussbarer ist das Modell. Findet im Rahmen der linearen Regression Anwendung.

 

 

Adjustiertes R-Quadrat

Das adjustierte R2 zeigt an, wie viel Varianz in der Gesamtpopulation, aus der die untersuchte Stichprobe gezogen wurde, durch das Modell erklärt wird. Je besser das berechnete Modell ist, desto kleiner ist der Unterschied zwischen R2 (Stichprobe) und adjustiertem R2 (Gesamtpopulation). Das adjustierte R2 wird deshalb (neben dem AIC oder BIC) als Kriterium für die Modellselektion verwendet.

 

 

Autokorrelation

Autokorrelation tritt dann auf, wenn die Residuen zweier Beobachtungen innerhalb eines linearen Regressionsmodells miteinander korrelieren (und somit abhängig voneinander) sind.

Siehe auch Durbin-Watson Test für genauere Informationen.

Autokorrelation ist auch im Rahmen der Zeitreihenanalyse von Bedeutung. Da dieses Glossar aber auf Medizinstatistik spezialisiert ist, wird nicht näher auf diesen Aspekt eingegangen.

 

 

Determinationskoeffizient

Der Determinationskoeffizient (auch R2genannt) beschreibt den Anteil der Varianz einer abhängigen Variablen, der durch eine einzige unabhängige Variable erklärt wird. Er entspricht im Falle eines Korrelationstests dem Quadrat der Produkt-Moment Korrelation nach Pearson.

Im Falle mehrerer unabhängiger Variablen (Prädiktoren), wird der multiple Determinationskoeffizient verwendet: Er beschreibt den Anteil der Varianz einer abhängigen Variable, der (z. B. in Regressionsmodellen) durch die Gesamtzahl der unabhängigen Variablen erklärt werden kann.

Das R2 steigt dabei durch die Hinzunahme weiterer Prädiktoren unweigerlich an, auch wenn die Prädiktoren auf Populationsebene nicht mit der abhängigen Variable zusammenhängen. Deshalb wird zur Modellselektion häufig das adjustierte R2, das AIC oder das BIC verwendet.

 

 

Standardisiertes Regressionsgewicht

Das standardisiertes Regressionsgewicht βi beschreibt die vorhergesagte Änderung im Kriterium bei einer Veränderung des Prädiktors im Rahmen der linearen Regression. Als Einheit für Prädiktor und Kriterium dient anders als beim unstandardisierten Regressionsgewicht nicht die gemessene Einheit von Prädiktor und Kriterium, sondern die Standardabweichung:

Wenn der Prädiktor um eine Standardabweichung erhöht wird und alle anderen Prädiktoren im Modell konstant gehalten werden (im Falle einer Moderation: wenn alle anderen Prädiktoren 0 sind), verändert sich das Kriterium um βi-Standardabweichungen. Das standardisiertes Regressionsgewicht βi beschreibt also die standardisierte Stärke des Zusammenhangs zwischen Prädiktor und Kriterium innerhalb der linearen Regression.

Der besondere Vorteil des standardisierten Regressionsgewichts ist die Vergleichbarkeit der jeweiligen Beziehungsstärken zwischen Prädiktoren und dem Kriterium, da die Einheiten der Prädiktoren und des Kriteriums durch die Standardisierung keine Rolle mehr spielen.

Beispiel:

β = – 0.238

Prädiktor = Körpergewicht in kg

Kriterium = Alter bei erstmaligen Herzinfarkt

Interpretation: Steigt das Körpergewicht um eine Standardabweichung, dann fällt das Alter beim erstmaligen Herzinfarkt um 0.238 Standardabweichungen.

Wichtig: Eine positives βi geht also mit einer Erhöhung des Kriteriums einher, ein negatives βi mit einer Verringerung.

 

 

Trag dich hier für Dr. Ortmanns beste Maildizin ein und erhalte regelmässige für deine empirische Promtion

You have Successfully Subscribed!