Liebe Community,
ich habe zwei Datensätze, die ich miteinander matchen möchte. Dies klappt aber nicht wie gewünscht.
Struktur des Datensatzes
- In dem Datensatz A stecken z.B. 2 Millionen Personen. In dem anderen Datensatz B ist eine kleinere Gruppe dieser zwei Millionen Personen enthalten.
- Es gibt eine eindeutige Fallnummer, die Fälle sind aber in jeder Tabelle chronologisch von oben nach unten arrangiert, d.h. es auf "SPSS Zeile 5" steht in Datensatz A eine andere Fallnummer wie in Datensatz B.
- Jede Fallnummer ist einmalig vorhanden und charakterisiert in Datensatz A und B dieselbe pro Person.
Zielsetzung des Matchings
Nun möchte ich für die Personen aus Datensatz B alle Informationen aus Datensatz A ergänzen. Ich möchte nicht, dass der Datensatz B um zusätzliche Personen aus Datensatz A erweitert wird.
Bisheriger Zugang zum Matching
- in Datensatz B --> Dateien zusammenfügen, externe SPSS-Datei laden (nämlich Datensatz A) --> Schlüsselvariable = Fallnummer --> Fälle nach Fallnummer abgleichen --> Datenset B ist Schlüsseltabelle
Probleme
- Datensatz B wird um alle Personen aus Datensatz A aufgefüllt (redundantes Datenmaterial, da ich nur Fälle brauche, die in A und B vorhanden sind).
- Wenn ich in Datensatz A und Datensatz B z.B. das Geschlecht einer spezifischen Fallnummer ausgeben lasse, erhalte ich unterschiedliche Werte, d.h. Fallnummer XY ist z.B. in Datensatz A eine Frau und in Datensatz B ein Mann. Das Matching scheint also nicht korrekt zu funktionieren.
Was mache ich falsch?