Hallo liebes Forum!
Ich hoffe, ihr könnt mir bei meiner Frage helfen.. Bei meiner Datenanalyse bin ich auf folgendes Problem gestoßen:
Ich bearbeite einen Datensatz, der mir von einem Forschungsinstitut zur Verfügung gestellt wurde. In diesem Datensatz ist u.a. die Variable Familienstand angegeben - sie kann verschiedene Ausprägungen annehmen (von 1=6 verheiratet bis 6 verwitwet). Da allerdings bei dieser Variable häufig fehlende Werte vorliegen, wurden anhand von 5 verschiedenen Schätzverfahren 5 mögliche Merkmalsausprägungen für den Familienstand ermittelt. D.h. der Teilnehmer "A" ist 5 Mal im Datensatz enthalten, wobei für seinen Familienstand ggf. verschiedene Merkmalsausprägungen angeben sind. Z.B. könnten zwei der Schätzverfahren die Ausprägung 1=verheiratet angeben, die restlichen 3 dagegen die Merkmalsausprägung 6=geschieden.
Da ich mich für meine weiteren Auswertungen jedoch für eine Merkmalsausprägung entscheiden muss, möchte ich hierbei auf den am häufigsten geschätzten Wert beziehen. In meinem Beispiel oben wäre dies die Merkmalsausprägung 6=geschieden, da diese von drei der fünf Schätzverfahren angegeben wird.
Meine Idee war nun, die Daten anhand des Modus zu aggregieren. Per Benutzeroberfläche lassen sich im Menü unter den Funktionen zum Aggregieren jedoch nur der Mittelwert, Median, die Summe und Standardabweichung auswählen.
Gibt es eine Möglichkeit, dies zu umgehen, z.B. per Syntax? Und wie könnte ein solcher Befehl aussehen?
Vielen Dank für eure Hilfe im Voraus!
Grüße,
Alina