Liebes SPSS-Forum,
ich habe eine Grundsatzfrage zu meinen Daten (Thema darf auch gern verschoben werden, falls falscher Thread).
Mein Daten wurden im Rahmen einer Umfrage erhoben. Der Datensatz setzt sich zusammen aus:
- Personencode
- Demographische Daten
- Körpergröße & Gewicht
- 2 Items mit 5-stufiger Likertskala
Außerdem wurde in dem Fragebogen eine offene Frage erhoben, in derTeilnehmer eine unbegrenzte Anzahl an Lieblingsspeisen nennen durften. Diese wurden anhand von dichotomen Variablen kategorisiert bzw. codiert ( 1 = der Kategorie zugehörig, 0 = nicht zugehörig).
So ergeben sich pro Personencode bis zu 21 Nennnungen (Speisen), die auf die oben genannte Art und Weise codiert wurden.
In SPSS wurde für jede Nennung eine neue Zeile angelegt, in der sich die Werte für die anderen Variablen jedes Mal wiederholen; die Zeilen unterscheiden sich also jeweils nur in der Codierung der Lieblingsspeise.
So kommt es, dass manche Personencodes etc. bis zu 21 mal vorkommen.
Wie kann man mit einem solchen Datensatz zum Beispiel die verschiedenen Mittelwerte berechnen?
Die eigentliche Idee des Datensatzes ist zu untersuchen, ob z.B. Geschlecht oder BMI mit der Wahl der Lieblingsspeise(n) zusammenhängen.
Wie vermeide ich, dass Ergebnisse durch Mehrfachnennungen verzerrt werden?
Ich hoffe, was ich meine, ist einigermaßen verständlich und jemand kann weiterhelfen.
Liebe Grüße
Lasagne Apfelmus