Habe ein Problem, was aber eher ein Anwendungsproblem ist und ich hoffe man kann mir kurz Helfen
Ich habe eine Grundgesamtheit von 5000 Daten.
Jeder Datensatz besteht aus:
Ergebnis ja/nein
Eigenschaft1 a/b/c/d
Eigenschaft2 a/b/c/d
Eigenschaft3 a/b/c/d
Eigenschaft4 a/b/c/d
Ich weiß dass alle Eigenschaften auf die Grundgesamtheit gleichmäßig verteilt sind, d.h. in den 5000 Daten kommen alle gleich oft vor.
Ich habe nun aber nur zum Ergebnis ja die genaue Verteilung der Eigenschaft, z.B:
ja; Eigenschaft1: b; Eigenschaft2: c; Eigenschaft3: c; Eigenschaft4: a
Es sind ca ~200 ja Ergebnisse und eben 4800 nein Ergebnisse
So wie ich das sehe, muss ich in SPSS aber alle Daten haben, damit ich eine multiple logistische Regression darauf anwenden kann, oder? Mir fehlen hierfür halt die 4800 nein Ergebnisse
Oder gibt es irgendwie einen Weg SPSS mitzuteilen, dass die Grundgesamtheit 5000 ist und alle Eigenschaft gleichoft vorkommen?