Angewandte Datenverarbeitung und Visualisierung
  • D. Palleschi
  • Moodle
  1. Kursübersicht
  2. Erforderliche Software
  • Kursübersicht
    • Kursübersicht
    • Erforderliche Software
    • Sitzungsinformationen
  • Grundlagen
    • 1  Einführung in R und RStudio
    • 2  Datenvisualiserung 1
    • 3  Dynamische Berichte mit Quarto
    • 4  Data Wrangling 1: Transformation
    • 5  Datenvisualisierung 2
  • Nächste Stufe
    • 6  Einlesen von Daten
    • 7  Deskriptive Statistik
    • 8  Datenvisualisierung 3
    • 9  Data Wrangling 2: Tidying
  • Fortgeschrittene Themen
    • 10  Base R
    • 11  Datenvisualisierung 4
    • 12  Troubleshooting
  • Berichte
    • 13  Bericht 1
    • 14  Bericht 2
  • Literaturverzeichnis
  • Anhang
    • A  Aufgaben

Kapitelinhalt

  • R und RStudio
    • Pakete
    • RStudio Globale Optionen (optional)
  • tinyTex
  1. Kursübersicht
  2. Erforderliche Software

Erforderliche Software

Dieses Dokument beschreibt die Schritte, die erforderlich sind, um unseren reproduzierbaren Arbeitsablauf für den Kurs ‘Angewandte Datenanalyse und -visualisierung’ einzurichten. R und RStudio gibt einen Überblick über die Installation von R, RStudio und der erforderlichen Pakete. Diese Schritte sind erforderlich. tinyTex beschreibt die Installation von TinyTex, das benötigt wird, um Dokumente im LaTeX-Stil (z.B. PDFs) in R darzustellen.

R und RStudio

Um an diesem Kurs teilnehmen zu können, müssen Sie R und RStudio installieren.

R ist eine statistische Programmiersprache, die für statistische Berechnungen und grafische Darstellungen verwendet wird. Am häufigsten wird sie zur Analyse und Visualisierung von Daten verwendet, beides werden wir in diesem Semester tun. RStudio ist eine IDE (integrierte Entwicklungsumgebung) für R und andere Sprachen. RStudio macht die Analyse und Visualisierung von Daten in R viel einfacher (glauben Sie mir, als ich mit R anfing, gab es kein RStudio!).

Sie müssen R herunterladen, bevor Sie RStudio herunterladen können.

  1. R herunterladen

  2. RStudio herunterladen

Pakete

R-Pakete, die im Comprehensive R Archive Network, allgemein bekannt als CRAN-Repository, verfügbar sind, können einfach mit dem Befehl install.packages("packageName") installiert werden. Einige Pakete, die wir brauchen werden, sind:

  • here Paket (Müller, 2020)
  • tidyverse-Paketfamilie (Wickham et al., 2019)
    • enthält automatisch Pakete, die wir brauchen, wie dplyr und ggplot2
  • languageR-Paket (Baayen & Shafaei-Bajestan, 2019)

Um mehrere Pakete auf einmal herunterzuladen, verwenden Sie die ‘concatenate’-Funktion in r (c()) innerhalb von install.packages():

install.packages(c("here", 
                   "tidyverse",
                   "pacman"))

RStudio Globale Optionen (optional)

Hier sind meine bevorzugten globalen Optionen (RStudio > Werkzeuge > Globale Optionen). Ich empfehle dringend, die Einstellungen für “Arbeitsbereich” und “R-Sitzungen” zu befolgen, um die Reproduzierbarkeit zu gewährleisten. Mit den anderen Einstellungen können Sie herumspielen, um herauszufinden, was Ihnen gefällt.

  • Allgemein > Grundeinstellungen
    • Arbeitsbereich (für reproduzierbare Arbeitsabläufe!!!)
      • Deaktivieren Sie das Kontrollkästchen “.RData beim Starten in Arbeitsbereich wiederherstellen”.
      • Arbeitsbereich beim Beenden in .RData speichern: Niemals
    • R-Sitzungen
      • Deaktivieren Sie das Kontrollkästchen “Zuvor geöffnete Quelldokumente beim Start wiederherstellen”.
  • Code > Anzeige
    • Allgemein
      • Leerzeichen anzeigen
      • Scrollen über das Ende des Dokuments hinaus zulassen
      • Ausgewählte Zeile hervorheben
  • Erscheinungsbild
    • Editor-Thema: Kobalt

tinyTex

Im weiteren Verlauf des Kurses werden wir lernen, wie man verschiedene Ausgabeformate, einschließlich PDF, erzeugt. Um PDF-Dokumente mit LaTeX unter der Haube darstellen zu können, müssen wir tinytex installieren (Xie, 2019). Es gibt verschiedene Möglichkeiten, dies zu tun:

  • Führen Sie folgendes im Terminal aus: quarto install tinytex
  • oder in der Konsole: tinytex::install_tinytex()
Baayen, R. H., & Shafaei-Bajestan, E. (2019). languageR: Analyzing Linguistic Data: A Practical Introduction to Statistics. https://CRAN.R-project.org/package=languageR
Müller, K. (2020). here: A Simpler Way to Find Your Files. https://CRAN.R-project.org/package=here
Wickham, H., Averick, M., Bryan, J., Chang, W., McGowan, L. D., François, R., Grolemund, G., Hayes, A., Henry, L., Hester, J., Kuhn, M., Pedersen, T. L., Miller, E., Bache, S. M., Müller, K., Ooms, J., Robinson, D., Seidel, D. P., Spinu, V., … Yutani, H. (2019). Welcome to the tidyverse. Journal of Open Source Software, 4(43), 1686. https://doi.org/10.21105/joss.01686
Xie, Y. (2019). TinyTeX: A lightweight, cross-platform, and easy-to-maintain LaTeX distribution based on TeX Live. TUGboat, 40(1), 30–32. https://tug.org/TUGboat/Contents/contents40-1.html
Kursübersicht
Sitzungsinformationen
Quellcode
```{r, echo = F}
knitr::opts_chunk$set(eval = F, # evaluate = T for REPRODUCIBLE analyses
                      echo = T, # 'print code chunk?'
                      message = F, # print messages?
                      error = F, # render even if errors encountered?
                      warning = F) # print warnings?
```

# Erforderliche Software {.unnumbered}

Dieses Dokument beschreibt die Schritte, die erforderlich sind, um unseren reproduzierbaren Arbeitsablauf für den Kurs 'Angewandte Datenanalyse und -visualisierung' einzurichten. @sec-R gibt einen Überblick über die Installation von R, RStudio und der erforderlichen Pakete. Diese Schritte sind erforderlich. @sec-tinytex beschreibt die Installation von TinyTex, das benötigt wird, um Dokumente im LaTeX-Stil (z.B. PDFs) in R darzustellen.

# R und RStudio {#sec-R}

Um an diesem Kurs teilnehmen zu können, müssen Sie R und RStudio installieren.

[R](https://www.r-project.org/about.html) ist eine statistische Programmiersprache, die für statistische Berechnungen und grafische Darstellungen verwendet wird. Am häufigsten wird sie zur Analyse und Visualisierung von Daten verwendet, beides werden wir in diesem Semester tun. [RStudio](https://posit.co/download/rstudio-desktop/) ist eine IDE (integrierte Entwicklungsumgebung) für R und andere Sprachen. RStudio macht die Analyse und Visualisierung von Daten in R viel einfacher (glauben Sie mir, als ich mit R anfing, gab es kein RStudio!).

Sie müssen R herunterladen, bevor Sie RStudio herunterladen können.

1. [R herunterladen](https://cran.r-project.org/)

2. [RStudio herunterladen](https://www.rstudio.com/products/rstudio/download/)

## Pakete {#sec-packages}

R-Pakete, die im Comprehensive R Archive Network, allgemein bekannt als CRAN-Repository, verfügbar sind, können einfach mit dem Befehl `install.packages("packageName")` installiert werden. Einige Pakete, die wir brauchen werden, sind:

- `here` Paket [@here-package]
- `tidyverse`-Paketfamilie [@tidyverse-package]
  - enthält automatisch Pakete, die wir brauchen, wie `dplyr` und `ggplot2`
- `languageR`-Paket [@languageR-package]
  
Um mehrere Pakete auf einmal herunterzuladen, verwenden Sie die 'concatenate'-Funktion in r (`c()`) innerhalb von `install.packages()`:

```{r, eval = F}
install.packages(c("here", 
                   "tidyverse",
                   "pacman"))
```

## RStudio Globale Optionen (optional)

Hier sind meine bevorzugten globalen Optionen (RStudio > Werkzeuge > Globale Optionen). Ich empfehle dringend, die Einstellungen für "Arbeitsbereich" und "R-Sitzungen" zu befolgen, um die Reproduzierbarkeit zu gewährleisten. Mit den anderen Einstellungen können Sie herumspielen, um herauszufinden, was Ihnen gefällt.

  - Allgemein > Grundeinstellungen
    - **Arbeitsbereich** (für reproduzierbare Arbeitsabläufe!!!)
        + Deaktivieren Sie das Kontrollkästchen ".RData beim Starten in Arbeitsbereich wiederherstellen".
        + Arbeitsbereich beim Beenden in .RData speichern: ***Niemals***
    - **R-Sitzungen**
        + Deaktivieren Sie das Kontrollkästchen "Zuvor geöffnete Quelldokumente beim Start wiederherstellen".
  - Code > Anzeige
    - Allgemein
      + Leerzeichen anzeigen
      + Scrollen über das Ende des Dokuments hinaus zulassen
      + Ausgewählte Zeile hervorheben
  - Erscheinungsbild
    - Editor-Thema: Kobalt

# tinyTex {#sec-tinytex}

Im weiteren Verlauf des Kurses werden wir lernen, wie man verschiedene Ausgabeformate, einschließlich PDF, erzeugt. Um PDF-Dokumente mit LaTeX unter der Haube darstellen zu können, müssen wir [tinytex](https://yihui.org/tinytex/) installieren [@tinytex-package]. Es gibt verschiedene Möglichkeiten, dies zu tun:

- Führen Sie folgendes im *Terminal* aus: `quarto install tinytex`
- oder in der Konsole: `tinytex::install_tinytex()`