Tutorial 5: Modellwahl
Lernziele
- Modellwahl mit Forward Selection, Backward Selection, AIC und BIC
- Loops als nützliche Tools
Setup
Erstellen Sie ein neues R-Projekt für dieses Tutorial und richten Sie eine passende Ordnerstruktur ein.
Aufgaben
Loops in R
Schleifen (“loops”) können redundanten Code erheblich vereinfachen.
- Schreiben Sie einen
for
-loop, der die Zahlen von 1 bis 10 ausgibt. - Schreiben Sie einen
for
-loop, der die Fibnocci-Zahlen bis 100 ausgibt.
Es gibt weitere Arten von loops wie while
oder die Möglichkeit mit apply
-Funktionen zu arbeiten.
Cars Dataset
Laden Sie den cars
-Datensatz in R mit data(mtcars)
und inspizieren Sie die Variablen in Bezug auf Struktur und Ausprägungen.
Wir interessieren uns für die Variable mpg
(Miles per Gallon) und möchten ein Modell erstellen, das den Zusammenhang zwischen mpg
und den anderen Variablen erklärt. Plotten Sie zunächst mpg
gegen gegen geeignete anderen Variablen.
Modellselektion mit Forward Selection
Implementieren Sie eine Forward Selection, um das beste Modell für mpg
zu finden mit Hilfe eines for
-loops.
Modellselektion mit Backward Selection
Implementieren Sie eine Backward Selection, um das beste Modell für mpg
zu finden mit Hilfe eines for
-loops.
Vergleichen Sie die Unterschiede.
AIC und BIC
Berechnen Sie die AIC und BIC einmal per Hand mit den Funktionen loglik
und dann mit AIC
und BIC
in R.
Diskussion
Was sind die Vor- und Nachteile von Forward und Backward Selection? Wann sind AIC und BIC sinnvoll?