Ziel des Lehrbuchs ist das Einüben und Umsetzen wichtiger Kompetenzen beim Datenhandling. So bestehen die ersten Schritte einer jeden empirischen Studie darin, die Daten für die eigene Analyse vorzubereiten. Das Bearbeiten (filtern, selektieren und ergänzen von Variablen) und das Strukturieren (gruppieren, zusammenfassen, zusammenfügen und bereinigen von Variablen und Datensätzen) der Daten legen dabei die fundamentale Grundlage jeder Empirie. Weiterführende Schritte zur Visualisierung und Analyse von Daten erlauben schließlich bedürfnisorientierte Gestaltungen der eigenen Datenanalyse.
Aus didaktischer Sicht ist dieses Lehrbuch ein “Mitmach”-Buch. Die Leser und Leserinnen des Lehrbuchs können hierzu die verschiedenen Datensätze und Skripte von der Webseite des Verlages herunterladen und lernen von Beginn an und Schritt für Schritt, wie wir die Daten bearbeiten, strukturieren, visualisieren und analysieren.
Der Inhalt
Daten bearbeiten und strukturieren mit tidyverse
Daten visualisieren mit ggplot
Weiterführende Visualisierungen mit ggplot, gganimate, stargazer und sf für Geodaten
Einführung in die simulationsbasierte Inferenzstatistik und „Machine Learning“ mit R
Die Autoren
Dr. Marc Scheufen ist Senior Economist im Themencluster Digitalisierung und Klimawandel am Institut der deutschen Wirtschaft und lehrt u.a. Statistik und Data Analytics an der Rheinischen Hochschule, Köln.
Dr. Armin Mertens ist Leiter des Kooperationsclusters Big Data Analytics am Institut der deutschen Wirtschaft, Köln.