Daten zusammenfügen/ Variablen hinzufügen

Alles rund um SPSS Syntax und Programmierung.

Daten zusammenfügen/ Variablen hinzufügen

Beitragvon Judith_W » Mi 15. Mär 2023, 19:06

Hallo zusammen,

ich möchte mehrere Variablen in meinen Datensatz anhand einer Schlüsselvariable hinzufügen. Bei der Schlüsselvariable handelt es sich um eine Nummer, die in beiden Datensätzen identisch ist.

Trotzdem wird beim Ausführen immer folgende Meldung angezeigt:

File #1 KEY: . >Warnungsnummer 5132 >Doppelter Schlüssel in einer Datei. Die BY-Variablen kennzeichnen nicht jeden >Fall in der angegebenen Datei eindeutig. Prüfen Sie die Ergebnisse >sorgfältig.


Den Datensatz zerhaut es dabei völlig.

Wo ist der Fehler? Ich verzweifle seit Tagen daran.

Besten Dank schonmal und Grüße,
Judith
Judith_W
 
Beiträge: 4
Registriert: Mi 15. Mär 2023, 18:58
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Daten zusammenfügen/ Variablen hinzufügen

Beitragvon ponderstibbons » Mi 15. Mär 2023, 20:37

Der Fehler lautet "Doppelter Schlüssel". Wie hast Du die Schlüsselvariablen auf doppelt vorkommende Werte überprüft?

Mit freundlichen Grüßen

PonderStibbons
ponderstibbons
 
Beiträge: 2523
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 2
Danke bekommen: 257 mal in 256 Posts

Re: Daten zusammenfügen/ Variablen hinzufügen

Beitragvon Judith_W » Mi 15. Mär 2023, 20:56

Die Schlüsselvariable ist ja die Variable, die in beiden Datensätzen vorhanden und identisch ist, richtig?

Die bin ich in beiden Datensätzen händisch durchgegangen. Das ist im Prinzip eine durchlaufende Nummer. Was meinst du mit doppelt vorkommenden Werten?

Freundliche Grüße,
Judith
Judith_W
 
Beiträge: 4
Registriert: Mi 15. Mär 2023, 18:58
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Daten zusammenfügen/ Variablen hinzufügen

Beitragvon ponderstibbons » Mi 15. Mär 2023, 21:39

Was meinst du mit doppelt vorkommenden Werten?

Ich meine das, was die Fehlermeldung sagt. In einer oder beiden Dateien kommen bei den Schlüsselvariablen Werte (hier: Nummern) doppelt vor. Deswegen kann man die Daten nicht eindeutig zuordnen.
Die bin ich in beiden Datensätzen händisch durchgegangen. Das ist im Prinzip eine durchlaufende Nummer.

Nur im Prinzip eine durchlaufende Nummer, oder tatsächlich? Und was heißt "händisch durchgegangen", was konkret hast Du überprüft?

Mit freundlichen Grüßen

PonderStibbons
ponderstibbons
 
Beiträge: 2523
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 2
Danke bekommen: 257 mal in 256 Posts

Re: Daten zusammenfügen/ Variablen hinzufügen

Beitragvon Judith_W » Do 16. Mär 2023, 11:06

Nur im Prinzip eine durchlaufende Nummer, oder tatsächlich? Und was heißt "händisch durchgegangen", was konkret hast Du überprüft?


Das sind tatsächlich Nummern, je Datensatz sind das 737 Fälle. Mit "händisch durchgegangen" meine ich: Ich habe mir alle 737 Nummern/ Benennungen der Schlüsselvariable in beiden Datensätzen angeguckt und sie stimmen überein.

In meinem "Hauptdatensatz" (der, in den die neuen Variablen hinzugefügt werden sollen) sind ursprünglich mehr Fälle vorhanden. Einige davon habe ich durch die Funktion "Fälle auswählen" ausgeblendet. Vielleicht hat das etwas damit zu tun?

Freundliche Grüße,
Judith
Judith_W
 
Beiträge: 4
Registriert: Mi 15. Mär 2023, 18:58
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Daten zusammenfügen/ Variablen hinzufügen

Beitragvon Lanin » Do 16. Mär 2023, 12:24

Doppelte Fälle erhälst Du einfach mit dem Menübefehl

Daten / Doppelte Fälle ermitteln

Keyvariable oben rein und im Feld darunter kannst Du optional festlegen, wie weiterhin sortiert werden soll.

In der neu erstellten Variable ist dann jeweils eine von den Dopplungen als primärer Fall gekennzeichnet und alle anderen als doppelte Fälle. Sind keine Fälle als doppelte Fälle gekennzeinet, kommt eine ID nur einmal vor (so wie es sein sollte).

Der Befehl "Fälle auswählen" ist für Deine Anforderungen nicht hilfreich.
Lanin
 
Beiträge: 18
Registriert: Mo 29. Aug 2022, 14:29
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Daten zusammenfügen/ Variablen hinzufügen

Beitragvon Judith_W » Do 16. Mär 2023, 12:36

Nachdem ich den Befehl doppelte Fälle ermitteln ausgeführt habe, werden mir die fehlenden Fälle nach oben sortiert (die brauche ich nicht für meine Analysen). Muss ich diese dann ausschließen, bevor ich die neuen Variablen hinzufüge?

Zusätzlich sollen auch noch andere Fälle ausgeschlossen werden.
Judith_W
 
Beiträge: 4
Registriert: Mi 15. Mär 2023, 18:58
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Daten zusammenfügen/ Variablen hinzufügen

Beitragvon Lanin » Do 16. Mär 2023, 14:39

Judith_W hat geschrieben:Nachdem ich den Befehl doppelte Fälle ermitteln ausgeführt habe, werden mir die fehlenden Fälle nach oben sortiert (die brauche ich nicht für meine Analysen). Muss ich diese dann ausschließen, bevor ich die neuen Variablen hinzufüge?

Zusätzlich sollen auch noch andere Fälle ausgeschlossen werden.



So einfach ist das nicht.

Zunächst einmal: Willst Du zwei Datensätze matchen, sollten mit "Daten/Fälle auswählen" nicht benötigte nicht benötigte Fälle nicht einfach ausgeschlossen (geflitert), sondern stattdessen gelöscht werden. Hierzu natürlich als neue Dateien speichern, um die alten für den Fall beizubehalten, dass Du zwischenzeitlich einen Fehler gemacht hattest.

Du musst Dir aber vorher vollkommen klar sein, was Du benötigst. Hast Du z.B. eine ID dreimal enthalten, kann es beispielsweise sein, dass
- genau diejenige als primär gekennzeichnet ist, die Du benötigst
- die tatsächlich benötigte ID als doppelter Fall gekennzeichnet ist und stattdessen die primäre nicht benötigt wird
- nur eine dieser IDs alle inhaltlichen Daten enthält und diese bei den anderen auf sysmis stehen
- jeweils alle doppelten IDs auch bei inhaltlchen Variablen identich sind
- Du mitunter doch einige oder alle doppelten Fälle benötigst, weil die Fälle tatsächlich unique sind und der einzige Fehler darin bestand, dass IDs doppelt vergeben wurden.

Manche der obigen Sachverhalte sind exklusiv, andere können gemeinsam in einem Datensatz zutreffen. Was bei Dir der Fall ist, lässt sich aus der Ferne nicht beurteilen, hierzu müsste man die Daten sehen. Eine konkrete Beschreibung, wie Du nun vorgehen musst, kann Dir daher niemand geben und Du musst Dir selbst die Daten genauer anschauen. Handelt es sich nur um wenige doppelte Fälle, kannst Du dies ggf. händisch überprüfen.

Ansonsten solltest Du zuerst ausführlich prüfen, wie die Dopplungen überhaupt zustande gekommen sind und erst dann wirst Du bei doppelten Fällen definieren können, nach welchen Regeln überflüssige Fälle gelöscht oder enthalten bleiben müssen. Hierbei ist wichtig, dass Du weißt, was Du tust. Auch muss es ja einen Grund geben, warum IDs in einem Datensatz mehrfach erscheinen.

Bei der Frage, inwieweit Fälle tatsächlich doppelt sind (dann müssten bei derselben ID jeweils auch bei allen anderen Variablen immer identisch sein), hilft Dir erneut die Prozedur "Doppelte Fälle ermitteln". Hierzu jeweils inhaltliche Variablen mit Ausnahme der ID eingeben. Gibt es dann keine doppelten Fälle, könnte es sein, dass IDs doppelt vergeben wurden, obwohl es sich um unterschiedliche Teilnehmende handelte.
Lanin
 
Beiträge: 18
Registriert: Mo 29. Aug 2022, 14:29
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu SPSS Syntax

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 13 Gäste

cron