Im Rahmen einer linearen Regression geben die Regressionsgewichte die durch das Regressionsmodell vorhergesagte Änderung der Kriteriumsvariablen in Folge einer Veränderung der Prädiktorvariablen an. Es lassen sich unstandardisierte und standardisierte Regressionsgewichte unterscheiden.
Das unstandardisiertes Regressionsgewicht:
Das unstandardisierte Regressionsgewicht bi (das sind die Regressionsgewichte, die bei SPSS oder R bei einer linearen Regression ausgegeben werden) gibt an, wie stark sich laut Vorhersage das Kriterium verändert, wenn die Prädiktorvariable um eine gemessene Einheit erhöht wird und alle anderen Prädiktoren konstant gehalten werden.
Wenn das Regressionsgewicht größer 0 ist, besteht ein positiver linearer Zusammenhang zwischen Prädiktor und Kriterium (bei Erhöhung des Prädiktorwerts erhöht sich auch der Wert des Kriteriums).
Wenn das Regressionsgewicht kleiner 0 ist, besteht ein negativer linearer Zusammenhang zwischen Prädiktor und Kriterium (bei Erhöhung des Prädiktorwerts verringert sich der Wert des Kriteriums).
Ein Beispiel:
Es soll durch eine einfache lineare Regression das Alter in Jahren beim erstmaligen Herzinfarkt (Kriterium) durch das Körpergewicht in kg (Prädiktor) vorhergesagt werden.
Man erhält ein Regressionsgewicht von b = – 0.15.
Das heißt also, dass sich pro zusätzlichem kg an Körpergewicht das vorhergesagte Alter des erstmaligen Herzinfarkts um 0.15 Jahre verringert.
Vorteil des unstandardisierten Regressionsgewichts ist die leichte Interpretierbarkeit, da Prädiktor und Kriterium beide in ihren ursprünglichen, gemessenen Einheiten interpretiert werden können. Das ist in der Medizin von großem, praktischem Nutzen.
Ein potentieller Nachteil ist allerdings, dass die Größe von bi natürlich von der Einheit abhängig ist, in der Prädiktor und Kriterium gemessen werden.
Hätte man in dem Beispiel von eben das Körpergewicht nicht in kg, sondern in Gramm erhoben, wäre das unstandardisierte Regressionsgewicht nun -0.00015.
Das bedeutet, dass die Höhe von bi stark von der gemessenen Einheit beeinflusst wird, was zu falschen Interpretationen führen kann, wenn die Einheit nicht berücksichtigt wird!
Ein weiterer Nachteil des unstandardisierten Regressionsgewichts ist, dass die absolute Größe von bi keinen Vergleich zwischen mehreren Prädiktoren erlaubt, und somit nicht abschätzbar ist, welcher Prädiktor denn nun den „stärksten Einfluss“ auf das Kriterium hat.
Würde man etwa in dem Beispiel von eben noch zusätzlich die Anzahl der pro Monat gerauchten Zigaretten als zweiten Prädiktor hinzunehmen und man bekäme als Regressionsgewichte
b1= – 0.15 (für das Körpergewicht in kg)
b2= -0.02 (für die Zigaretten pro Monat),
dann hieße das natürlich nicht zwangsweise, dass das Körpergewicht einen „stärkeren Einfluss“ auf das Alter beim erstmaligen Herzinfarkt hat als das Rauchen, denn beide beziehen sich auf unterschiedliche Grundeinheiten (Körpergewicht in kg vs. Zigaretten pro Monat).
Aber wie kann man herausfinden, welcher Prädiktor den größeren Einfluss hat?
Dieses Problem löst das standardisierte Regressionsgewicht:
Das standardisierte Regressionsgewicht bi* gibt die vorhergesagte Änderung nicht in den gemessenen Einheiten von Prädiktor und Kriterium an, sondern in Standardabweichungen.
bi* gibt also an, um wie viele Standardabweichungen sich das Kriterium verändert, wenn der Prädiktor um eine Standardabweichung erhöht wird und erlaubt durch die Standardisierung den Vergleich zwischen den Regressionsgewichten.
Bekommt man etwa in unserem Beispiel die standardisierten Regressionsgewichte
b1*= – 0.025 (für das Körpergewicht in kg)
b2*= – 0.38 (für die Zigaretten pro Monat),
dann kann man das folgendermaßen interpretieren:
Pro zusätzlicher Standardabweichung Körpergewicht verringert sich das erstmalige Alter eines Herzinfarkts um 0.025 Standardabweichungen. Pro zusätzlicher Standardabweichung gerauchter Zigaretten verringert sich das erstmalige Alter eines Herzinfarkts hingegen um 0.38 Standardabweichungen. Also um deutlich mehr.
Diese beiden Regressionsgewichte lassen sich aufgrund der Standardisierung nun problemlos miteinander vergleichen.
Heißt das, dass wir uns rein auf das standardisierte Regressionsgewicht konzentrieren sollten?
Nein!
Wir empfehlen, dass du dir immer beide Regressionsgewichtstypen ansiehst, denn die klinische Bedeutsamkeit lässt sich leichter anhand des unstandardisierten Regressionsgewichts ableiten, da sie die ursprünglich gemessene Einheit berücksichtigt und somit eine leichtere klinische Interpretation des Effektes erlaubt (für den Kliniker ist es leichter und nützlicher „kg“ zu interpretieren als Standardabweichungen).
Denke dabei aber immer daran, die gemessene Einheit zu berücksichtigen, sodass du die unstandardisierten Regressionsgewichte korrekt interpretierst!