Einführung in R für Ärzte

Einführung in R für Ärzte

In diesem Artikel gibt R-Fachmann Simon Wilms eine Einführung in R für Ärzte und zeigt, wie der Einstieg in das Statistiktool einfach und effizient gelingt.

 

Ich bin Simon und arbeite seit 2018 als R-Spezialist in Magdalenes Team. Ich liebe R und werte meine Daten jetzt schon viele Jahre mit nichts anderem aus. R ist mein Ding!

 

Wenn ich eines sicher weiß, dann, dass in R wirklich jede Analyse machbar ist.

Heute arbeite ich unheimlich effizient mit R und kann zum Beispiel publikationsreife Grafiken in Minutenschnelle erstellen. Früher habe ich das in SPSS gemacht und das Ergebnis konnte sich sehen lassen – allerdings hat es ewig gedauert!

Das war aber nicht immer so. Die einzelnen Analysen konnte ich mir schon zu Beginn ganz gut selbst beibringen, aber mir fehlten die Grundlagen. Ohne Grundlagen stolpert man sich in R sehr, sehr langsam vorwärts und hört schnell wieder auf (fragt Magdalene, die konnte vor unserem Kurs ein Lied davon singen). In vielen, vielen einsamen Stunden habe ich mir die Grundlagen zusammengegoogelt, Bücher gelesen, verschiedene Pakete ausprobiert, bis ich endlich den effektivsten Weg für meine Datenanalyse gefunden hatte. Das war eine Offenbarung.

R ist eigentlich gar nicht kompliziert

Man muss einfach nur verstehen, wie es geht! Da ich anderen ebenfalls einen einfachen Einstieg in R ermöglichen möchte, gebe ich mittlerweile R-Kurse für Wissenschaftler und Doktoranden und zeige ihnen, wie sie die Datenanalyse in R am schnellsten erlernen können.

Um auch dich von R zu überzeugen, möchte ich dir in diesem Artikel einfach mal eine kleine Einführung in R geben (und dich missionieren, ist ja klar).

Im Grunde ist R nichts anderes als ein Taschenrechner. Ok, es ist ein recht komplexer Taschenrechner, aber man kann damit ganz normal rechnen:

oder

Weiterhin kann man auch sogenannte „logische Vergleiche“ anwenden, zum Beispiel: „Ist die Zahl 5 größer als die Zahl 3?“


Ja, das stimmt (R sagt „TRUE“). Wir können auch fragen: „Ist 5 das Gleiche wie 3?“

Nö. Die Rechnerei kann ich problemlos mit den logischen Vergleichen kombinieren: „Ist die Summe aus 3 und 2 größer als das Produkt von 2 und 2?“


Ja.

Arbeiten mit Datensätzen – Die Basics

Zugegeben, um es bloß als Taschenrechner zu nutzen, brauchst du R nicht zu lernen, aber solche auf den ersten Blick sinnlosen Basics werden später relevant, zum Beispiel beim Filtern von Daten. Ich habe hier mal einen Beispieldatensatz mitgebracht: In diesem wurde der Einfluss des Geschlechts (m = männlich, w = weiblich), dreier Medikamente (A, B, C) und des Cholesterinspiegels auf das Risiko, einen Herzinfarkt zu bekommen (hoch, niedrig), untersucht.

 

Einzelne Variablen in Datensätzen (hier Cholesterol) werden in R mit dem $-Zeichen angesprochen:

 

 

Da sind sie, unsere ganzen Cholesterolwerte. Mit eckigen Klammern kann ich Variablen (oder auch ganze Datensätze) filtern.
Und hier kommen schon die logischen Vergleiche ins Spiel. So wählst du alle Cholesterolwerte aus, die größer sind als 5:

 

Siehst du? Ein Befehl und alles ist erledigt!

Dabei muss R immer wissen, woher die Variablen, auf die ich mich beziehe, kommen (nämlich aus dem Datensatz data). Deshalb schreibe ich auch immer ein data$ davor. Das mag auf den ersten Blick anstrengend wirken, macht das Ganze aber auch super flexibel, denn so kann ich mich in einem Befehl auf mehrere verschiedene Datensätze beziehen.

 

 

Daten flexibel filtern

Aber zurück zum Datenfiltern: Die Filterbedingung kann ich beliebig komplex gestalten.
Jetzt möchte ich alle Werte über 5 herausfiltern, aber nur, wenn die teilnehmende Person weiblich ist:

 

 

Mehrere Filterbedingungen kann ich also mit dem Und-Zeichen (&) verknüpfen. Das Oder-Zeichen ist übrigens |. Hat man sich solche Kniffe einmal gemerkt, wird man zunehmend schneller als beim Klicken durch ein Programm, wie das in anderen Auswertungsprogrammen der Fall ist.

 

 

Der pipe operator

Jetzt möchte ich dir gerne noch den pipe operator %>% vorstellen. Was das sein soll? Es ist eines meiner Lieblingssymbole in R. Der pipe operator bedeutet dabei so viel wie „nimm, was davorsteht, und mache damit, was danach steht“. Hier ein Beispiel aus der deskriptiven Statistik:

 

 

Also: Nimm was davor steht (den Datensatz data) und mache damit, was danach steht (nämlich: Wende den Befehl get_summary_stats an). Im Befehl get_summary_stats steht dann noch die Variable, für die ich mich interessiere (cholesterol). Mit type = mean_sd“) teile ich R mit, dass ich nur den Mittelwert und die Standardabweichung haben möchte.

So weit, so gut. Aber was, wenn ich ebendiese deskriptive Statistik nur für die Frauen haben möchte?

 

 

Antwort: Mehr pipe operators!

In diesem Fall sage ich R also „Nimm die Daten und wende den Befehl filter an. Innerhalb von filter soll die Bedingung geschlecht == „w“) gelten. Dann nimm die gefilterten (!) Daten und wende, wie gerade eben auch, get_summary_stats an. Klingt logisch, oder?

Ich kann sogar noch mehr Befehle dazwischenschalten. Bevor ich mit den gefilterten Daten irgendetwas mit get_summary_stats berechne, kann ich sie mit group_by noch gruppieren, zum Beispiel nach Medikament (A, B, C):

 

 

Und weil das noch nicht genug ist, erlaubt mir group_by sogar, mehrere Gruppierungsvariablen einzusetzen. Hier gruppiere ich nach Medikament und Geschlecht, bevor ich den Mittelwert und die Standardabweichung berechne:

 

 

Wenn man es so Schritt für Schritt aufschreibt, werden die komplexesten Befehle auf einmal kinderleicht.

Wichtig ist nur, dass man diese Grundlagen einmal richtig lernt. Als ich das erste Mal das komische Symbol %>% gesehen habe, habe ich nur Spanisch verstanden. Außerdem gibt es in R Tausende Befehle, sodass meistens viele Wege nach Rom führen.

Für jede noch so schwierige Analyse gibt es mittlerweile ein Paket und für Standardanalysen gibt es zig Pakete.
Dadurch kann es schwierig sein, allein den Einstieg in R zu finden.

Daher habe ich in Zusammenarbeit mit Magdalene einen Grundlagenkurs für die Analyse deiner medizinischen Studiendaten in R entwickelt. Ich habe dabei all jene Pakete und Befehle ausgewählt, mit denen ich die besten Erfahrungen gemacht habe, und zeige dir Schritt für Schritt, wie R funktioniert.

 

Du siehst: R ist ein fantastisches Tool. Wofür ich am Anfang noch Stunden gebraucht habe,

erledige ich heute in Minuten. Und du schaffst das auch!

R-Basics – Der Grundlagenkurs

 

In dem Kurs geht es zunächst um grundlegende Dinge. Wie strukturiere ich meine Daten? Wie filtere ich Daten und erstelle Teildatensätze? Wie erstelle ich neue Variablen? Wie gehe ich mit fehlenden Werten um? Das sind alles Dinge, die möglicherweise in anderen Statistikprogrammen schneller von der Hand gehen, denn dort musst du anstelle eines Codes nur irgendwo draufklicken.

Wer aber einmal die Arbeit auf sich nimmt und wirklich versteht, wie R funktioniert und das bloße Datenmanagement beherrscht, der wird in Zukunft viel Zeit und Geld sparen (denn: R ist kostenlos!).

Den größten Vorteil bietet R aber immer dann, wenn man einzelne Veränderungen im Ausgangsdatensatz vornehmen muss. Während man in diesem Fall in SPSS die komplette Analyse wiederholen muss (Klick, Klick, Klick, Klick – ich will ja nicht lästern …), kannst du in R dein Skript einfach neu starten und schon hast du alle Änderungen eingearbeitet.

 

Ich behaupte: Wenn zwei Personen R bzw. SPSS lernen, dann ist die Person mit SPSS in den ersten Wochen schneller. Nach einer gewissen Übungszeit kann die Person, die R gelernt hat, die Auswertungen aber deutlich effizienter durchführen und wunderschöne Grafiken fünfmal so schnell erstellen. Es zahlt sich also aus!

 

Damit du also einen maximalen Vorteil hast, haben Magdalene und ich diesen ersten R-Kurs so konzipiert, dass du nicht nur lernst, wie R funktioniert, sondern am Ende die komplette Vorverarbeitung deines Datensatzes abgeschlossen, eine perfekte deskriptive Analyse deiner Daten erstellt und die ersten leichten Tests gerechnet hast. Dieser Kurs lohnt sich also in jeder Hinsicht.

In dem R-Onlinekurs begleiten wir Dich von Anfang an, beginnend mit der Installation von R und R Studio. Im folgenden Video zeigen wie dir, wie du in R starten kannst.

Wenn du mehr über unseren Kurs erfahren willst,

dann schau doch einfach mal vorbei!

Desiree Freier: Mein steiniger Weg zum Dr.med.

Desiree Freier: Mein steiniger Weg zum Dr.med.

Mein Name ist Désirée und ich freue mich, heute bei meiner Kollegin Dr. Magdalene Ortmann einen Gastbeitrag schreiben zu dürfen. Ich begleite als Ärztin und Wissenschaftlerin an der Charité erfolgreich Doktorand*innen zu ihrer Promotion. Ich habe selbst an der Charité-Universitätsmedizin studiert und bin seit 2014 in der Wissenschaft tätig. In meiner Freizeit habe ich für meine Doktorand*innen „Step-by-Step zum Doktor med“ gegründet.

 

Ich möchte euch heute von meinem teilweise steinigen Weg während der Promotionsphase erzählen und euch damit Mut machen. Mein Weg war nicht immer eben, aber ich habe es geschafft, alle Hürden zu überwinden, und mittlerweile einen Expertenstatus erreicht, den mir keiner mehr nehmen kann.

 

Vergleich 3er verschiedener exponentieller Wachstumskurven des Coronavirus.

 

Meinen Einstieg in das Thema Promotion fand ich als Studentin im 6. Semester im Zuge einer wissenschaftlichen Hausarbeit. Hier beschäftigte ich mich mit dem Thema Burnout bei Rheumapatienten und war das erste Mal während des Studiums auf mich allein gestellt. Eine systematische Literaturrecherche sollte es werden. Dunkel erinnerte ich mich, dass ich dazu im vorherigen Semester einen Kurs belegte, in dem ich allerdings eher meinen nächsten Sommerurlaub plante. „Warum nur “, fragte ich mich, „… hast du nicht besser aufgepasst?! Jetzt hast du den Salat!“

 

Ich saß also an meinem Schreibtisch und wusste nicht, wo ich anfangen sollte. Warum ich damals in dem Kurs nicht aufgepasst hatte, war mir eigentlich schnell klar: Zu diesem Zeitpunkt brauchte ich dieses Wissen nicht. Jetzt hätte ich es gerne noch einmal abgerufen, aber Online-Kurse waren zu diesem Zeitpunkt noch ein Fremdwort in der Uni.

 

Also suchte ich nach Möglichkeiten, um mir einen Überblick darüber zu verschaffen, wie ich eine systematische Literaturrecherche schreibe. Meine Betreuerin war mir dabei leider keine große Hilfe, da sie selbst viel zu tun hatte. Zudem war es aber auch nicht ihre Aufgabe, denn eigentlich hätte ich die nötigen Grundlagen ja bereits gelernt.  

 

Das Internet war bei meiner Suche nach einer Strategie für die systematische Literaturrecherche leider überhaupt nicht hilfreich. Ich schrieb mich also letzten Endes in einen von der Universität angebotenen Promotionskurs ein, um wenigstens einen groben Überblick zu erhalten, obwohl ich noch gar nicht an meine Promotion dachte. Dieser Kurs war insgesamt wirklich gut – aber vertiefende Details zu meinen Fragen bezüglich der Hausarbeit erhielt ich leider auch dort nicht.

 

Ich wusste jetzt aber zumindest, dass man mit PubMed am besten eine MeSH-Term-Suche durchführt und dann die Literaturergebnisse erhält. Mir blieb im Endeffekt nichts anderes übrig, als einfach loszuarbeiten und meine Betreuerin mit Emails zu bombardieren. Im Nachhinein sind mir Emails wie „Ich habe jetzt hier drei passende Literaturquellen gefunden, könnten Sie mal schauen, ob diese so passen?“ sehr unangenehm, aber ich wusste es schlichtweg nicht besser.

 

Mein Expertentipp: Heute empfehle ich dringend, die Literaturrecherche frühzeitig, am besten direkt zu Beginn einer jeden Promotion durchzuführen.

 

Hätte ich damals schon meine Arbeitsweise von heute an den Tag gelegt, hätte ich mir viel Zeit gespart. Bei diesem Arbeitsprinzip geht es darum, dass mit nur 20 % des Aufwands rund 80 % des Ergebnisses erarbeitet werden.

 

Einen wertvollen Tipp zur effektiven Literaturrecherche gebe ich euch an dieser Stelle bereits vorab: Dokumentiert jeden Suchschritt in einer Tabelle, damit ihr zu einem späteren Zeitpunkt nicht noch einmal von vorne anfangen müsst, sondern einfach updaten könnt.

 

Die Literaturrecherche wird standardmäßig auf der Datenbank PubMed betrieben; idealerweise sollte dort mit sogenannten MeSH Terms gearbeitet werden. Jedoch gibt es auch weitere Datenbanken, wie die Cochrane Libary, die ich auch für sehr wichtig erachte. Das Entscheidende bei der Literaturrecherche ist, dass ihr nicht jeden Artikel vollständig lesen müsst. Eure Arbeit sollte aber den Anspruch haben, dass ihr möglichst von allen Artikeln Kenntnis habt, die zu diesem Thema existieren.

 

Das einfache Prinzip an meiner Vorgehensweise der effektiven Literaturrecherche ist, dass ich die Literatur in meinen eigenen Worten stichpunktartig in einer Tabelle zusammenfasse und dabei gleich den Autor, das Jahr und die PMID notiere. Außerdem habe ich ein Priorisierungssystem entwickelt. Klingt banal, ist es aber nicht!

 

Wenn ihr diesen Schatz einmal erarbeitet habt, schreibt sich eure Einleitung fast selbst – ganz egal, wann ihr die Literatur gelesen habt. Ich profitiere heute noch von meinen Tabellen aus dem Jahr 2015, wenn ich Vorträge zu psychologischen Themen in der Rheumatologie halte. Gleichzeitig hat die frühzeitige und ausführliche Literaturrecherche den Vorteil, dass ihr genau wisst, worauf es bei eurer Arbeit ankommt, um einzigartig zu sein.

 

Zurück zu meiner wissenschaftlichen Hausarbeit: Das Feedback meiner Betreuung war trotz aller Bemühungen niederschmetternd. Neben den inhaltlichen Verbesserungsvorschlägen kamen Sätze wie „Wollen Sie wirklich eine Arbeit abgeben, die nicht einmal im Blocksatz formatiert ist?“ oder „Was haben Sie da für eine kindische Schriftart gewählt, diese ist nicht gängig für wissenschaftliche Arbeiten, das nehme ich so nicht an!“ und vieles mehr.

 

Wie ich mich dabei fühlte? Ihr könnt es euch sicher denken: Ich fühlte mich so unfähig und stümperhaft wie noch nie zuvor in meinem Leben. Entscheidend ist aber, was ich später feststellen durfte: Wir alle haben Fehler gemacht. Wichtig ist, dass wir daraus lernen.

 

Diesen Anspruch habe ich auch an meine eigenen Doktorand*innen und Studierenden in wissenschaftlichen Arbeiten. Ein Fehler wird genau einmal gemacht, ausgebessert und dann möglichst für immer vermieden.

 

Dass ein wissenschaftlicher Text im Blocksatz und in den Schriftarten Arial oder Times New Roman verfasst werden sollte, ist vielen zu Beginn der Wissenschaftskarriere noch gar nicht bewusst. Auch die DIN-Norm möchte ich an dieser Stelle zu erwähnen, die in all euren Tabellen und Grafiken sichtbar werden sollte – mehr Infos dazu findet ihr auf meinem Blog.

 

Nun ging es also auch bei mir endlich an die Promotion. Zwar wusste ich nun, wie ich die Literaturrecherche durchführe, wie ich jedoch eine ganze Studie planen soll, das wusste ich nicht. Es ging also wieder von vorn los … wieder klägliche Planungsversuche, wieder das Gefühl, nichts zu können, wieder Fehler, die ich gerne von vornherein vermieden hätte, wenn es mir jemand gesagt hätte.

 

Ich hatte den Eindruck, dass jeder meiner Schritte nach vorn genau drei Schritte zurück bedeutet. Aber auch diese Hürden meisterte ich, wenn auch mit einigen Umwegen, die ich euch ersparen möchte.

 

Heute erkläre ich meinen Doktorand*innen genau, worauf es bei einer guten Studienplanung ankommt. Auch hier hat mich der steinige Weg meiner eigenen Promotion zum Experten gemacht: Ich musste alle Anträge (Ethik- und Datenschutzantrag sowie Eintragung in das klinische Studienregister) selbst schreiben und wurde dafür von einigen Kommilitonen sogar belächelt.

 

Heute bin ich dankbar dafür, weil ich genau weiß, worauf es formal und inhaltlich bei der Planung einer Studie ankommt. Jede gute Studie beruht auf einem ausführlichen Projektplan und benötigt einen genehmigten Ethikantrag sowie ein positives Datenschutzvotum. Außerdem muss sie in ein Studienregister (z. B. Clinical Trials) eingetragen werden.

 

Mein Expertentipp: Achtet darauf, dass all diese Dokumente vorhanden sind, bevor ihr mit eurer Studie loslegt.

 

Nutzt außerdem die wertvollen Informationen, die dort geschrieben stehen. Hier könnt ihr vieles für den methodischen Teil eurer Arbeit nutzen. Auf meinem Blog beschreibe ich euch noch, wie ihr diese Dokumente gut verwenden könnt.

 

 

Mittlerweile habe ich mehrere Publikationen veröffentlicht und wende dabei jedes Mal dieselbe, von mir etablierte, Vorgehensweise an. Das bewährte Konzept, das ich mir erarbeitet habe, entstand dadurch, dass ich bereits während der steinigen Promotionsphase immer genau so viel Eigenverantwortung übertragen bekommen habe, dass ich an meine Grenzen stieß, aber durch die Ratschläge und Einwände meiner Betreuerin doch zum Ziel kam.  

 

Über die Zeit lernte ich alles, was man für die Wissenschaft benötigt. Meine erste Erkenntnis war retrospektiv betrachtet, dass meine Studie, die ich eigenständig plante, ein sehr aufwändiges Projekt war. Dies war in meinem Fall kein Hindernis, da ich mich bereits entschieden hatte, den Weg der Universitätskarriere einzuschlagen.Ich berate allerdings heute meine Klient*innen und Doktorand*innen, die sich bewerben, sehr genau bezüglich der Themenwahl zur Promotion.  

 

Eine Promotion ist sehr zeitaufwändig – egal, welche Form der Promotion ihr wählt oder wie motiviert ihr seid. Viele externe Gegebenheiten, wie zum Beispiel die Zustimmung der Ethikkommission oder das unterschiedliche Patientenaufkommen, kosten teilweise enorm viel Zeit und Nerven. Viele experimentelle Doktorarbeiten werden sogar deshalb abgebrochen, weil ein Experiment noch nicht etabliert ist und nicht so gelingt, wie es geplant war.  

 

Ein weiterer wichtiger Punkt bei der Wahl des Promotionsthemas ist neben dem Aufwand auch die dahinterstehende Betreuung. Ihr müsst bedenken, dass ihr mit diesem Menschen wahrscheinlich über mehrere Jahre  eng zusammenarbeitet. Auch hierzu ist noch ein gesonderter Blogbeitrag von mir geplant, da ich dieses Thema für enorm wichtig erachte.  

 

Da für mich, wie auch für meine Kollegin Frau Dr. Ortmann, die gute wissenschaftliche Praxis und die Prozessoptimierung an erster Stelle stehen, möchte ich mein Wissen mit euch teilen und euch einige Stolpersteine während der Promotion ersparen.  

 

Ich habe deshalb eine Anleitung zu allen Grundsätzen und wichtigen Rahmenbedingungen der medizinischen Promotion in einem Online-Kurs zusammengefasst.  

 

Je mehr wir wissen, desto weniger angreifbar sind wir!  

 

Neben den persönlichen zeitfressenden Stolpersteinen können leider auch ernsthafte Konsequenzen aus Unwissenheit entstehen. Gerade hinsichtlich des Datenschutzes sind in den letzten Jahren immer strengere Richtlinien für klinische Studien entstanden. Wusstet ihr zum Beispiel, dass es strengstens untersagt ist, die Primärdaten, welche selbstverständlich von euch vollständig pseudonymisiert worden sind, neben dem Ordner mit der Patienten-Identifikationsliste abzustellen? Dies ist nur eines von vielen Beispielen zum datenschutzkonformen Umgang mit Patientendaten.  

 

Leider gilt hier der Grundsatz: Unwissenheit schützt vor Strafe nicht!   Ich hatte das Glück in einem Studienteam zu sein, welches eine eigene Datenschutzbeauftragte hatte, die mir alles erklärte. Vielen geht es allerdings nicht so. Vielleicht wisst ihr am Ende sogar am meisten darüber …  

 

Auch ein transparenter Umgang mit wissenschaftlichen Daten hinsichtlich der Auswertung ist enorm wichtig. Man kann immer irgendetwas berechnen, nur ob es Sinn ergibt oder gar versehentlich Aussagen verdreht, ist nicht immer klar. Deshalb empfehle ich an dieser Stelle auch immer mit Menschen wie Frau Dr. Ortmann zusammenzuarbeiten. Überlasst die Statistik den Profis! Auch ich hole mir immer wieder statistische Beratung für meine Studien.  

 

Mein Fazit aus dem teils steinigen Weg zur Promotion ist, dass ich keinen meiner Schritte bereue, weil sie mich zu der Frau gemacht haben, die ich heute bin, nämlich eine Ärztin, Wissenschaftlerin und leidenschaftliche Promotionscoachin. Möchtet ihr eine Abkürzung gehen und einen Weg mit weniger Stolperfallen und Steinen beschreiten? Dann schaut gern bei mir auf der Website vorbei oder schreibt mir eine E-Mail (stepbystepzumdoktormed@gmail.com).  

 

Ich hoffe, ich konnte euch mit diesem Beitrag motivieren, nicht aufzugeben. Lasst euch nicht von Fehlern oder Kritik durch eure Betreuung entmutigen. Es ist noch kein*e Experte*in vom Himmel gefallen, aber wir alle können dazu werden.  

 

Eure Désirée  

 

Trag dich hier für Dr. Ortmanns beste Maildizin ein und erhalte regelmässige Tipps für deine medizinische Promotion

 

Trag dich hier für Dr. Ortmanns beste Maildizin ein und erhalte regelmässige Tipps für deine empirische Promotion

You have Successfully Subscribed!