Session 12



Bootstrapping

Lernziele

  • Wiederholung Stichprobenziehung und
  • Einführung in Bootstrapping

Wiederholung: Stichprobenziehung

Stichprobenziehung

  • Grundgesamtheit häufig schwierig komplett zu beobachten
  • daher: Stichproben
  • Beispiel: Zensus, Wahlbefragung, …
  • hier: Zufallsstichproben

Beispiel mit R

  • Setting: Europawahl 2024
  • Wähler mit Attributen und Wahlpräferenzen
  • große Grundgesamtheit, daher samplen
  • Parameter der Grundgesamtheit: z.B. der wahre Anteil von Studierenden unter den Wählern
  • Schätzer für Parameter der Grundgesamtheit: Anteil der Studierenden, berechnet aus der zufälligen Stichprobe
    • da Stichprobe zufällig ist, repräsentativ für Grundgesamtheit und Schätzer unverzerrt
> wähler
        person_id alter einkommen         beruf verheiratet kinder
            <int> <int>     <num>        <char>      <char>  <num>
     1:         1    37     48193   Selbständig        Nein      1
     2:         2    78     13735   Arbeiter/in        Nein      0
     3:         3    41     20673 Studierende/r          Ja      1
     4:         4    22     19289   Selbständig        Nein      0
     5:         5    79     19717   Arbeiter/in          Ja      1
    ---                                                           
 99996:     99996    27     32280   Arbeiter/in          Ja      0
 99997:     99997    70     22035   Arbeiter/in        Nein      0
 99998:     99998    29     21863   Arbeiter/in        Nein      0
 99999:     99999    24     24526 Angestellte/r        Nein      0
100000:    100000    44     19918   Arbeiter/in        Nein      1
        verkehrsmittel              partei
                <char>              <char>
     1:        Fahrrad Konservative Partei
     2:           Auto     Liberale Partei
     3:           Auto      Soziale Partei
     4:           Auto Konservative Partei
     5:           Auto      Soziale Partei
    ---                                   
 99996:           Auto      Soziale Partei
 99997:           Auto      Soziale Partei
 99998:        Fahrrad      Soziale Partei
 99999:           Auto      Soziale Partei
100000:           Auto        Grüne Partei

zufällige Stichprobe

  • \(n\) Beobachtungen aus der Grundgesamtheit zufällig auswählen
  • Beobachtungen sollten nicht mehrfach vorkommen
  • Stichprobengröße beeinflusst Standardfehler
    • je größer desto repräsentativer!

Sampling-Methoden im Überblick

  • Einfache Zufallsstichprobe (Simple Random Sampling) mit/ohne Zurücklegen
  • Geschichtete Stichprobe (Stratified Sampling): Reduziert Varianz in Teilgruppen
  • Klumpenstichprobe (Cluster Sampling): Ganze Cluster (z.B. Gemeinden) auswählen
  • Systematische Stichprobe: Auswahl jedes k-ten Elements aus geordneter Liste
  • Varianzen der Schätzer hängen vom Stichprobendesign ab

Wiederholung: Jackknife-Resampling

  • Leave-One-Out-Ansatz: Für \(i = 1, \dots, n\) entferne Datenpunkt \(i\) aus der Stichprobe.
  • Schätzer in jeder Teilstichprobe: \(\hat\theta_{(i)}\).
  • Jackknife-Bias: \[ \mathrm{Bias}_{\mathrm{jack}} = (n-1)\bigl(\bar\theta_{(\cdot)} - \hat\theta\bigr), \quad \bar\theta_{(\cdot)} = \frac{1}{n}\sum_{i=1}^n \hat\theta_{(i)} \]
  • Jackknife-Varianz: \[ \mathrm{Var}_{\mathrm{jack}} = \frac{n-1}{n}\sum_{i=1}^n \bigl(\hat\theta_{(i)} - \bar\theta_{(\cdot)}\bigr)^2. \]
  • Vorteil: Einfache Bias-Korrektur; Nachteil: konservativ für kleine \(n\).
#| code-fold: false
jack_means <- sapply(seq_along(wähler$alter),
                     function(i) mean(wähler$alter[-i]))
hist(jack_means, breaks = 30,
     main = "Jackknife-Verteilung des Mittelwerts",
     xlab = "Mittelwert (Alter)")

Bootstrapping

Einführung in Bootstrapping

  • Statistiken aus Stichproben sind Zufallsvariablen
    • Stichprobenverteilung mit Mittelwert und Standardfehler
  • Beispiel: Anteil der Studierenden in Stichprobe
    • Schätzer für den wahren Anteil der Studierenden bei allen Wählern

Einführung in Bootstrapping

  • Problem: In Realität schwierig sehr viele Stichproben zu ziehen
  • Lösung: Mit einer einzigen Stichprobe arbeiten!

Einführung in Bootstrapping

Einführung in Bootstrapping

Einführung in Bootstrapping

Einführung in Bootstrapping

Einführung in Bootstrapping

“To pull oneself up by one’s bootstraps” — sich am eigenen Schopf aus dem Sumpf ziehen

Einführung in Bootstrapping

Einführung in Bootstrapping