So erstellst du ganz leicht ein Diagramm mit Boxplots in R – Video-Tutorial!

So erstellst du ganz leicht ein Diagramm mit Boxplots in R – Video-Tutorial!

In diesem Artikel zeigen wir dir, wie du schnell und einfach ein professionelles Diagramm mit Boxplots in R erstellst.

Und keine Angst, dafür musst du nicht programmieren können, sondern einfach nur nachmachen, was wir dir im folgenden Schritt-für-Schritt-Video zeigen.

Bevor es aber losgeht:

In diesem Artikel verwenden wir das Tool ggplot, das du kostenlos innerhalb von R verwenden kannst und mit dem du professionelle Grafiken in wenigen Minuten erstellen kannst. Wie du R installierst und wie R aufgebaut ist, zeigen wir dir in diesem Video.

Die Wahl des richtigen Diagramms

 Diagramme mit Boxplots sind sehr gut dazu geeignet die Studienergebnisse verschiedener Gruppen und/ oder Zeitpunkte anhand von Medianen und Quartilen darzustellen.

Sie werden immer dann verwendet, sobald die Vorbedingungen eines Linien- oder Balkendiagramms für Mittelwerte nicht erfüllt werden.

Dies ist z.B. dann der Fall, wenn du zwar metrisch skalierte Variablen, wie z.B. kg oder Minuten darstellen möchtest, diese aber nicht normalverteilt sind.

Boxplots werden aber auch dafür verwendet ordinalskalierte Variablen darzustellen, deren Ausprägungen graduell sind. Solche Variablen erkennst du daran, dass sich ihre Ausprägungen gut in eine Reihenfolge bringen lassen, wie z.B. die Antwortmöglichkeiten innerhalb eines Fragebogens wie: stimme gar nicht zu, stimme eher nicht zu, neutral, stimme ein wenig zu, stimme voll zu.

Ordinale Variablen solltest du dabei vorab immer als äquivalente Folge von Zahlen codieren, wie z.B. -2, -1, 0, 1, 2, damit du sie sinnvoll in einem Boxplot darstellen kannst.

Falls du dich nun fragst, was ein Boxplot eigentlich ist, und was du an ihm ablesen kannst, kannst du das in diesem Glossar-Eintrag nachlesen.

Klicke hier, falls du doch lieber Balkendiagramme (für Mittelwerte und Häufigkeiten) oder Liniendiagramme erstellen möchtest.

Eine Übersicht über alle verschiedenen Diagrammtypen, und eine Erklärung wann du sie am besten verwendest, findest du hier.

So, nun geht es aber los!

Folgendes Diagramm mit Boxplots werden wir im Videotutorial erstellen:

R Grafiken Boxplots Schmerzempfinden

In diesem Video findest du nun eine einfache Schritt-für-Schritt-Anleitung für dein Boxplotdiagramm:

Falls dir das schon mal geholfen hat, du aber deine Diagramme noch schneller erstellen möchtest, dann schau doch mal hier in unseren Mini-Kurs für das Erstellen von Grafiken in R.

In diesem Kurs geben wir dir die hier verwendeten R-Skripte für viele verschiedene Diagrammtypen und zeigen dir anhand der Vorlagen, wie du die Grafiken sehr schnell nach deinen Wünschen anpassen kannst – und zwar ohne Vorkenntnisse und jegliche Erfahrung in R.

R Grafiken Banner Onlinekurs
R Grafiken Banner Onlinekurs Mobile
So erstellst du Schritt für Schritt ein Liniendiagramm in R – Video-Tutorial!

So erstellst du Schritt für Schritt ein Liniendiagramm in R – Video-Tutorial!

In diesem Artikel zeigen wir dir, wie du schnell und einfach ein professionelles Liniendiagramm in R erstellst.

Und keine Angst, dafür musst du nicht programmieren können, sondern einfach nur nachmachen, was wir dir im folgenden Schritt-für-Schritt-Video zeigen.

Bevor es aber losgeht:

In diesem Artikel verwenden wir das Tool ggplot, das du kostenlos innerhalb von R verwenden kannst und mit dem du professionelle Grafiken in wenigen Minuten erstellen kannst. Wie du R installierst und wie R aufgebaut ist, zeigen wir dir in diesem Video.

Die Wahl des richtigen Diagramms

Liniendiagramme sind dabei sehr gut dazu geeignet die Studienergebnisse verschiedener Gruppen anhand von Mittelwerten und Standardabweichungen über die Zeit hinweg darzustellen.

Sie sind sehr übersichtlich und ermöglichen es Effekte sehr leicht und schnell zu erkennen.

Als Vorbedingung benötigst du metrisch skalierte Variablen, die normalverteilt sind. Nur dann sind die dargestellten Mittelwerte und Standardabweichungen aussagekräftig.

Ist dies nicht der Fall, verwende lieber Boxplots.

Möchtest du anstatt Liniendiagramme lieber Balkendiagramme erstellen, dann zeigen wir dir hier, wie du sie erstellst: Balkendiagramm für Mittelwerte & Balkendiagramm für Häufigkeiten.

Eine Übersicht über alle verschiedenen Diagrammtypen, und eine Erklärung wann du sie am besten verwendest, findest du hier.

So, nun geht es aber los!

Folgendes Liniendiagramm werden wir im Videotutorial erstellen:

R Grafiken Liniendiagramm Schmerzmittel

In diesem Video findest du nun eine einfache Schritt-für-Schritt-Anleitung für dein Liniendiagramm:

Falls dir das schon mal geholfen hat, du aber deine Diagramme noch schneller erstellen möchtest, dann schau doch mal hier in unseren Mini-Kurs für das Erstellen von Grafiken in R.

In diesem Kurs geben wir dir die hier verwendeten R-Skripte als Vorlagen für viele verschiedene Diagrammtypen und zeigen dir, wie du die Grafiken sehr schnell nach deinen Wünschen anpassen kannst – und zwar ohne Vorkenntnisse und jegliche Erfahrung in R.

R Grafiken Banner Onlinekurs
R Grafiken Banner Onlinekurs Mobile
So erstellst du ganz einfach ein Streudiagramm in R – Video-Tutorial!

So erstellst du ganz einfach ein Streudiagramm in R – Video-Tutorial!

In diesem Artikel zeigen wir dir, wie du schnell und einfach ein professionelles Streudiagramm in R erstellst.

Und keine Angst, dafür musst du nicht programmieren können, sondern einfach nur nachmachen, was wir dir im folgenden Schritt-für-Schritt-Video zeigen.

Bevor es aber losgeht:

In diesem Artikel verwenden wir das Tool ggplot, das du kostenlos innerhalb von R verwenden kannst und mit dem du professionelle Grafiken in wenigen Minuten erstellen kannst. Wie du R installierst und wie R aufgebaut ist, zeigen wir dir in diesem Video.

Die Wahl des richtigen Diagramms

Streudiagramme werden immer dann verwendet, wenn du Zusammenhänge zwischen zwei metrischen, zwei ordinalen oder einer metrischen und einer ordinalskalierten Variablen darstellen möchtest.

Sie eignen sich prima dafür, die Stärke und die Richtung von Zusammenhängen herauszuarbeiten und diese in Form von Korrelationsgeraden darzustellen.

Es ist sogar möglich, verschiedene Gruppen in ein und demselben Streudiagramm darzustellen.

Da sie sehr übersichtlich sind, ist die Interpretation der Effekte sehr einfach.

Eine Übersicht über weitere Diagrammtypen, und eine Erklärung wann du sie am besten verwendest, findest du hier.

So, nun geht es aber los!

Folgendes Streudiagramm werden wir im Videotutorial erstellen:

R Grafiken Streudiagramm

In diesem Video findest du nun eine einfache Schritt-für-Schritt-Anleitung für dein Streudiagramm:

Falls dir das schon mal geholfen hat, du aber deine Diagramme noch schneller erstellen möchtest, dann schau doch mal hier in unseren Mini-Kurs für das Erstellen von Grafiken in R.

In diesem Kurs geben wir dir die hier verwendeten R-Skripte und Vorlagen für viele verschiedene Diagrammtypen. Wir zeigen dir, wie du die Grafiken sehr schnell nach deinen Wünschen anpassen kannst – und zwar ohne Vorkenntnisse und jegliche Erfahrung in R.

R Grafiken Banner Onlinekurs
R Grafiken Banner Onlinekurs Mobile
So erstellst du schnell ein Balkendiagramm für Mittelwerte in R – Video-Tutorial!

So erstellst du schnell ein Balkendiagramm für Mittelwerte in R – Video-Tutorial!

In diesem Artikel zeigen wir dir, wie du schnell und einfach ein professionelles Säulendiagramm für Mittelwerte in R erstellst.

Keine Angst, dafür musst du nicht programmieren können, sondern einfach nur nachmachen, was wir dir im folgenden Schritt-für-Schritt-Video zeigen.

Bevor es aber losgeht:

In diesem Artikel verwenden wir das Tool ggplot, dass du kostenlos innerhalb von R verwenden kannst und mit dem du professionelle Grafiken in wenigen Minuten erstellst. Wie du R installierst und wie es aufgebaut ist, zeigen dir in diesem Video.

Die Wahl des richtigen Diagramms

 

Balkendiagramme für Mittelwerte sind sehr gut dazu geeignet die Studienergebnisse verschiedener Gruppen über verschiedene Bedingungen hinweg darzustellen.

 

Sie stellen dabei für jede einzelne Bedingung einzeln den Mittelwert und die Standardabweichung der gemessenen Werte dar. Du kannst aber auch ein anderes Maß der Streuung auswählen, z.B. den Standardfehler oder das Konfidenzintervall für den Mittelwert.

Als Vorbedingung benötigst du metrisch skalierte Variablen, die normalverteilt sind. Nur dann sind deine Mittelwerte und Standardabweichungen aussagekräftig.

Ist dies nicht der Fall, dann verwende lieber Boxplots.

Möchtest du lieber ein Liniendiagramm anstatt eines Balkendiagramms erstellen, dann zeigen wir dir hier, wie das geht. Dies ist insbesondere dann sinnvoll, wenn du Messwiederholungen darstellen möchtest.

Eine Anleitung für ein Balkendiagramm für Häufigkeiten findest du hier.

Eine Übersicht über alle verschiedenen Diagrammtypen, und eine Erklärung wann du sie jeweils am besten verwendest, findest du hier.

So, nun geht es aber los!

Folgendes Säulendiagramm für Mittelwerte werden wir im Videotutorial erstellen:

R Grafiken Balkendiagramm für Mittelwerte

In diesem Video findest du nun eine einfache Schritt-für-Schritt-Anleitung für dein Balkendiagramm:

Falls dir das schon mal geholfen hat, du aber deine Diagramme noch schneller erstellen möchtest, dann schau doch mal hier in unseren Mini-Kurs für das Erstellen von Grafiken in R.

In diesem Kurs geben wir dir die hier verwendeten R-Skripte und Vorlagen für viele verschiedene Diagrammtypen. Wir zeigen dir, wie du die Grafiken sehr schnell nach deinen Wünschen anpassen kannst – und zwar ohne Vorkenntnisse und jegliche Erfahrung in R.

R Grafiken Banner Onlinekurs
R Grafiken Banner Onlinekurs Mobile
Wie du die ewige Liebe mit der Bland-Altman-Methode findest

Wie du die ewige Liebe mit der Bland-Altman-Methode findest

Wer sucht sie nicht – die ewige Liebe. Egal, welcher Altersgruppe, Herkunft oder Bildungsschicht wir angehören, jeder Mensch sehnt sich nach Zugehörigkeit, Liebe und Geborgenheit.

Je jünger wir sind, desto mehr wird dieses Gefühl von dem Drang nach Abenteuer und Aufregung überlagert, aber….

 

—– SPOILERALARM ——

 

….in den allermeisten Fällen führen schwierige Beziehungen mit Partnern, die sich an der Grenze zur Persönlichkeitsstörung bewegen, nicht zum langfristig gewünschten Ergebnis.

 

Spätestens in den frühen Dreißigern hat es aber jeder kapiert: Eine stabile Liebe finden wir bei einem Menschen, dem wir vertrauen können, weil er uns so annimmt, wie wir sind. Bei jemandem, der uns nicht wahnsinnig macht, weil er immer wieder über unsere persönlichen Grenzen hinweg trampelt.

Frau schaut in ein Mikroskop

Formelsammlung Bland-Altman-Plot

Dauerhafte, tiefe Liebe, so erklärte es mir mal ein Freund kurz vor seiner Hochzeit,  findet man beim besten Freund – zumindest wenn man ihn zufällig auch noch äußerst attraktiv findet.

 

Die große Liebe basiert also in letzten Konsequenz auf Übereinstimmung.

 

Und die ist messbar.

 

Vergleich 3er verschiedener exponentieller Wachstumskurven des Coronavirus.

 

Zum einen bietet sich da natürlich das eigene Gefühl an. Als ich meinen Mann vor fast 10 Jahren auf einer WG-Party kennenlernte, war die Sache für mich innerhalb von wenigen Minuten klar:

 

Er war nicht nur sehr attraktiv und sehr klug, sondern gab mir zum ersten Mal in meinem Leben das Gefühl, dass ich nicht zu irgendwas war. Zu nerdig, zu ambitioniert, zu fokussiert. Wir waren uns einfach total ähnlich.

 

Hätte ich aber auf Nummer sicher gehen wollen, hätte ich unser Beziehungspotential auch mathematisch berechnen können. 1986 publizierten Martin Bland und Douglas Altman, zwei Epidemiologen aus Großbritannien, eine ebenso einfache wie auch geniale Methode, um Übereinstimmung zu messen.

 

(Foto: Bland & Altman, 1981)

 

Ihnen begegnete in klinischen Publikationen nämlich immer wieder der gleiche Fehler:

 

Übereinstimmung, insbesondere zweier klinischer Messverfahren, wurde entweder anhand einfacher Korrelationstests überprüft (Heißt: Die Messwerte beider Methoden korrelieren positiv, also messen beide Methoden das Gleiche), oder anhand der fehlenden Signifikanz gerechneter T-Tests (Heißt: da es keinen signifikanten Unterschied zwischen den Werten beider Messverfahren gibt, müssen die Verfahren wohl gut übereinstimmen).

 

Während die Verwendung von Korrelationstests nur leicht falsch ist, war die Verwendung von T-Tests total daneben. Dies beruht auf den statistischen Grundlagen des Tests:

 

Eine Korrelation tritt nämlich auch dann auf, wenn beide Messreihen und die ihnen zugrunde liegenden Methoden eine intensive Beziehung zueinander haben. Das − und da verweise ich kurz auf all die missglückten Beziehungen, bevor ich meinen Mann traf −  ist aber nicht das Gleiche wie eine hohe Übereinstimmung.

 

 

Bei T-Tests ist es noch schlimmer: Eine fehlende Signifikanz kann durch sehr viele verschiedene Faktoren herbeigeführt werden, allen voran durch eine kleine Stichprobe. Indem ich also möglichst wenige Messungen miteinander vergleiche, erhöhe ich die Wahrscheinlichkeit, keinen signifikanten Unterschied zwischen den zwei Messverfahren zu erhalten. Wer da nicht auf falsche Gedanken kommt …

 

Was haben also Bland und Altman gemacht?

 

Sie haben sich überlegt, dass die Übereinstimmung zweier klinischer Messverfahren wahrscheinlich dann am größten ist, wenn der Unterschied zwischen den beiden am kleinsten ist.

 

Dieser Gedanke war so neu und gleichzeitig so revolutionär einfach, dass die dazugehörige Publikation (Bland and Altman, 1986) bis zum heutigen Tag 45.562 mal zitiert wurde.

 

Durch die neu entwickelte Bland-Altman-Methode hatten Mediziner nun ein einfaches Instrument, mit dessen Hilfe sie bestimmen konnten, ob ein neues Messverfahren ein altes, aufwendigeres ersetzen konnte.

 

Und wie funktioniert das Verfahren genau?

 

Ganz einfach:

 

  • Zuerst misst man bei möglichst vielen Patienten den Zielparameter einmal mit Methode A und gleich danach noch einmal mit Methode B.
  • Danach bildet man für jeden Patienten sowohl den Durchschnitt (MW) als auch die Differenz aus beiden Messpunkten (Diff = xMethode A – xMethode B). 
  • Der Durchschnitt beider Messungen ist dabei ein Indikator für den wahren Wert des zu messenden Parameters. Da kein Messverfahren der Welt den wahren Wert genau darstellen kann (es sei denn, wir befinden uns im Bereich der Kalibrierung), können wir uns dem wahren Wert immer nur annähern – und in diesem Fall wird dies über den Mittelwert beider Messverfahren versucht.

Im nächsten Schritt wird für die Gesamtheit der ermittelten Differenzen beider Messverfahren sowohl der Gruppenmittelwert () als auch die Standardabweichung (s) berechnet. Wir haben nun also einen Wert für die mittlere Abweichung und einen für die mittlere Streuung der Differenzen.

 

Und nun wird das Ganze im Bland-Altman-Plot visualisiert:

 

(aus: Giavarina, 2015) 

Hierfür wird eine Grafik mit 4 Teilen gebaut:

 

  • Auf der x-Achse wird der Mittelwert der jeweiligen Paare beider Methoden dargestellt, auf der y-Achse deren Differenzen. 
  • Eine gestrichelte horizontale 0-Linie zeigt die Linie der perfekten Übereinstimmung an, da hier die Differenz = 0 wäre. 
  • Auf einer zweiten horizontalen Linie wird der Mittelwert der Differenzen (Bias oder ) eingezeichnet. 
  • Oben und unten werden horizontale Linien für die Limits of Agreement (LOAs), definiert über ± 1,96s der Differenzen, wie oben berechnet, geplottet. 
  • Und zum Schluss wird für jeden der berechneten Parameter das jeweilige 95 %-Konfidenzintervall schraffiert (grau hinterlegte Flächen).

 

In dieses Gerüst werden nun für jeden Patienten der Durchschnitt (x-Achse) und die Differenz beider Messungen als Punkte eingetragen und fertig ist der Bland-Altman-Plot.

 

 

Interpretation des Bland-Altman-Plots

 

 1. Abstand der Linie der mittleren Differenz () zur 0-Linie:

 

Der Abstand beider Linien sollte möglichst gering sein. Je kleiner der Abstand, desto stärker stimmen die Methoden im Mittel überein. Den Unterschied zwischen beiden Linien nennt man Bias. Er ist ein Indikator dafür, ob die neue Methode das zu messende Konstrukt im Vergleich zur Standardmethoden über- oder unterschätzt (je nachdem, ob die Differenz ein positives oder negatives Vorzeichen hat).

 

2. Abstand der LOAs zur Linie der mittleren Differenz:

 

Die LOAs werden anhand der Streuung der Differenzen berechnet und enthalten aufgrund ihrer festgelegten Breite von ± 1,96 Standardabweichungen (s) 95 % aller berechneten Differenzen – zumindest dann, wenn die Differenzen normalverteilt sind, was aber fast immer der Fall ist.

 

Heißt das also, dass die Methoden übereinstimmen, wenn 95 % der Punkte innerhalb der LOAs liegen?

  

Nein, eben nicht.

 

Der Position der LOAs auf der y-Achse überdeckt per Definition 95 % aller Punkte, da die Breite mit ± 1,96 s entsprechend ausgewählt wurde.

 

Anhand der Limits of Agreement kann man also nicht nachweisen, DASS beide Messverfahren übereinstimmen, sondern nur, wie stark die Streuung der Differenzen ist.

 

Ob das nun klinisch viel oder wenig ist und somit die Übereinstimmung klein oder groß ist, muss anhand vorab festgelegter Grenzwerte bestimmt werden.

 

Eine Frage, die sich also alle Forschenden VOR Beginn der Studie stellen sollten, ist, wie groß die mittlere Abweichung vom Mittelwert der Differenzen sein darf, um auch mit der neuen Methode noch gute Ergebnisse erzielen zu können.

 

Liegen die LOAs also innerhalb der a priori festgelegten klinisch sinnvollen Grenzwerte, dann stimmen die Methoden ausreichend stark überein.

 

3. Die 95 %-Konfidenzintervalle:

 

Da wir in jeder Studie nur eine begrenzte Stichprobe untersuchen, wird in jedem guten Bland-Altman-Plot sowohl für die mittlere Differenz als auch für beide LOAs ein 95 %-Konfidenzintervall eingezeichnet.

 

Diese Intervalle sind sehr nützlich, weil sie uns einen weiteren Indikator dafür liefern, wie sehr sich die Ergebnisse der Studie auf die Gesamtbevölkerung übertragen lassen.

 

Das Konfidenzintervall überdeckt den „wahren“ Wert innerhalb der Gesamtbevölkerung mit einer Wahrscheinlichkeit von 95 %. Je schmaler also das 95 %-KI, desto repräsentativer ist unsere Stichprobe und desto mehr dürfen wir unseren Ergebnissen trauen.

 

Zusammenfassung:

 

Die Bland-Altman-Methode erlaubt eine Beurteilung darüber, mit welcher Übereinstimmung zwei Messmethoden denselben klinischen Parameter messen.

 

Sie basiert nicht auf einem Signifikanztest, sondern erfordert eine kritische Einschätzung der Ergebnisse und ein gewissenhaftes Vorgehen, bei dem die Grenze der Übereinstimmung zwischen beiden Methoden schon vor Beginn der Studie anhand klinischer Parameter festgelegt werden muss.

 

Damit die Methode bestmöglich funktioniert, müssen einige Vorbedingungen erfüllt sein:

 

  1. Die einzelnen Messpaare sollten unabhängig voneinander sein. Das bedeutet, dass jeder Proband nur einmal an der Studie teilgenommen haben sollte und nicht mehrfach.
  1. Die Differenzen sollten zufällig und nicht systematisch variieren. Das heißt, die Werte auf der y-Achse sollten nicht parallel zu steigenden Werten auf der x-Achse größer oder kleiner werden.
  1. Die Differenzen beider Messverfahren sollten über die Patienten hinweg normalverteilt sein. Das sind sie aber zum Glück meistens.

 

Hältst du bei der Planung deiner Studie diese Vorbedingungen ein, ist ein sehr gutes Ergebnis wahrscheinlich.

 

Was bleibt:

 

Nachdem mein Mann (ein Wirtschaftsinformatiker) am Ende der WG-Party zu dem Schluss kam, dass es durchaus eine gute Idee wäre, mich auch über diesen ersten Abend hinaus besser kennenzulernen, telefonierten wir während der nächsten Wochen jeden Abend mindestens eine Stunde miteinander und redeten und redeten und redeten.

 

Da wir beide keine Fans großer Gefühlsbekundungen sind, war es mein größtes Glück, als er mir ein paar Monate später anstelle seiner Liebe mit großem Ernst erklärte:

 

„Leni, du bist der Mensch, der mir von allen auf der Welt am wenigsten auf die Nerven geht.“

 

Ab diesem Moment, in dem wir all unsere Differenzen quantifiziert und sie für ausreichend klein befunden hatten, war uns beiden klar, dass wir die große Liebe gefunden hatten.

 

 

 

Literatur:

Bland, J.M., Altman, D.G., 1986. Statistical Methods for assessing Agreement between two methods of clinical measurement. Lancet 1, 307–310.

Giavarina, D., 2015. Understanding Bland Altman analysis. Lessons Biostat. Underst. 25, 141–151.

 

Lade dir hier unsere kostenlose Formelsammlung

zum Bland-Altman-Plot herunter!

Lade dir hier die Formelsammlung für deinen Bland-Altman-Plot herunter

Melde dich für meinen Newsletter an und erhalte sofort das PDF!

You have Successfully Subscribed!

10 % Rabatt auf unsereWorkshops & Kurse im Onlineshop!

Trage dich hier für Dr. Ortmanns beste Maildizin ein und erhalte regelmäßige Rabatte, Tipps und Coachinginhalte für deine empirische Promotion

You have Successfully Subscribed!

Lade dir hier die Checkliste für deinen Methodenteil herunter

Melde dich für meinen Newsletter an und erhalte sofort das PDF!

You have Successfully Subscribed!


Jetzt 10 % Rabatt auf alle

Workshops & Kurse sichern!

You have Successfully Subscribed!

Downloade dir hier das Flowchart für deine ANOVA

Melde dich für meinen Newsletter an und erhalte sofort das PDF!

You have Successfully Subscribed!

Lade dir hier die Vorlage für den Aufbau deines Datensatzes herunter

Melde dich für meinen Newsletter an und erhalte sofort die Excel-Vorlage!

You have Successfully Subscribed!