Abgabezettel 1: Exporte aus Kolumbien

Zurück zur Startseite

Ziel des ersten Abgabezettels ist die Anwendung verschiedener Regressionsmodelle, die Zusammenhänge zwischen Variablen eines Datensatzes mit kolumbianischen Außenhandelsdaten auf Firmenebene zu modellieren und zu interpretieren. Der Datensatz enthält bspw. Informationen über die Anzahl der exportierten Produkte, die Anzahl der bedienten Märkte, die Absatzgröße und weitere relevante Firmendaten.

Anleitung

Bitte bearbeiten Sie alle Aufgaben. Nutzen Sie die in der Vorlesung und in den Tutorien genutzten R-Befehle. Dokumentieren Sie Ihre Schritte gut mittels Textblöcken in Quarto Markdown oder Kommentaren in R-Code. Jede Teilaufgabe muss über den Code hinaus eine kurze Beschreibung beinhalten. Stellen Sie sicher, dass der Code reproduzierbar ist, d.h. der/die Prüfer den Code ausführen kann.

Daten

Jede/r Studierende erhält eine personalisierte Stichprobe aus dem folgenden Datensatz: https://statistik.julianhinz.com/abgabe/abgabe1.csv

Nachdem Sie die Daten in R geladen haben, ziehen Sie bitte wie folgt eine Stichprobe hieraus:

set.seed(12345678) # Matrikelnummer ist der Seed
daten <- daten[sample(1:nrow(daten), 1000),] # 1000 Zeilen der Daten zufällig auswählen
Wichtig

Achtung: Ersetzen Sie bitte 12345678 durch Ihre Matrikelnummer und daten durch den von Ihnen gewählten Namen des Objektes des Datensatzes.

Warnung

Achtung: Wenn sie die Funktion sample() mehrfach ausführen ändert sich ihre Stichprobe! Gehen Sie sicher, dass Ihr Code reproduzierbar ist, indem Sie vor der Abgabe alles noch einmal vollständig durchlaufen lassen.

Einreichung

Format: Als Quarto Markdown (.qmd) oder R-Datei (.R) per E-Mail an: abgabe-internationale-vwl@uni-bielefeld.de

Abgabefrist: 24. Mai AoE



Aufgabe 1: Setup

  1. RStudio Projekt und Ordnerstruktur
    • Erstellen und nutzen Sie ein neues RStudio-Projekt. Richten Sie eine geeignete Ordnerstruktur ein.
      Nenne die Ordner “Daten”, “Ergebnisse” und “Scripte”.
    • Beschreiben Sie kurz die Vorteile dieses Setups.
  2. Packages installieren und laden
    • Installieren und laden Sie die erforderlichen R-Packages für Ihre Analyse. Automatisieren Sie dieses Vorgehen so weit wie möglich.
    • Beschreiben Sie die Vorteile dieses Vorgehens.
  3. Daten herunterladen und speichern
    • Laden Sie die kolumbianischen Außenhandelsdaten programmatisch herunter und speichern Sie diese in einem geeigneten Ordner.
  4. Dateninspektion
    • Laden Sie die Daten in R und ziehen Sie die Stichprobe wie oben beschrieben. Von nun an arbeiten Sie nur mit dieser personalisierten Stichprobe.
    • Inspizieren Sie diese mit geeigneten Befehlen. Gehen Sie auf die Struktur des Datensatzes und der Variablen ein, auch unter Verwendung von Visualisierungen.


Aufgabe 2: Analyse von linearen Zusammenhängen

  1. Modellierung und Schätzung
    • Nutzen Sie im Folgenden nur die Beobachtungen, in denen das Zielland USA ist.
    • Entwickeln Sie ein Modell, um die Gesamtexporte eines Unternehmens zu modellieren und zu erklären. Transformieren Sie die abhängige Variable wie in Tutorium 2.
    • Erläutern Sie, warum Sie dieses Modell gewählt haben und welche Annahmen dabei gemacht werden.
  2. Interpretation
    • Interpretieren Sie die Ergebnisse der Schätzung des Modells. Vergleichen und diskutieren Sie die Wahl Ihres präferierten Modells gegenüber einer vereinfachten und einer komplexeren Variante des Modells anhand geeigneter Methoden.
    • Was ist die Interpretation des Koeffizienten einer logarithmierten erklärenden Variable?
    • Welche Schlüsse können Sie über die Beziehungen zwischen den Variablen ziehen?


Aufgabe 3: Analyse von Zähldaten

  1. Datenanalyse
    • Nutzen Sie im Folgenden weiterhin nur die Beobachtungen, in denen das Zielland USA ist.
    • Analysieren Sie die Anzahl der Produkte, die die Unternehmen exportieren.
    • Visualisieren Sie die abhängige Variable.
  2. Modellierung und Schätzung
    • Wählen Sie einen geeigneten Schätzer und geeignete Variablen zur Modellierung aus.
    • Erläutern Sie, warum Sie dieses Modell gewählt haben und welche Annahmen dabei gemacht werden.
  3. Interpretation
    • Überprüfen und interpretieren Sie die Ergebnisse der Schätzung des Modells.
    • Berechnen Sie die Wahrscheinlichkeit, dass ein mittelgroßes Unternehmen, das neben den USA in nur zwei weitere Länder exportiert, insgesamt weniger als 5 Produkte verkauft.


Aufgabe 4: Analyse von binären Daten

  1. Datenanalyse
    • Nutzen Sie nun den gesamten Datensatz. Untersuchen Sie die Faktoren, die Einfluss darauf haben, ob ein Unternehmen in die USA exportiert oder nicht.
    • Visualisieren Sie zunächst die abhängige Variable sinnvoll.
  2. Modellierung und Schätzung
    • Entwickeln Sie ein Modell zur Analyse der binären Daten.
    • Erläutern Sie, warum Sie dieses Modell gewählt haben und welche Annahmen dabei gemacht werden.
  3. Interpretation
    • Interpretieren Sie die Ergebnisse des Modells.
    • Wie sind die Odds, dass ein Unternehmen, das 10 Produkte exportiert, auf dem amerikanischen Markt vertreten ist?
    • Welche Schlüsse können Sie über die Beziehungen zwischen den Variablen ziehen?


Zurück zur Startseite