Hallo Zusammen,
Ich habe einen Datensatz mit zwei verschiedenen Messzeitpunkten in einer Längsschnittuntersuchung, für den ich Korrelationen berechnen möchte. Es sollten alle Fälle ausgeschlossen werden, bei denen mehr als 20% der Werte fehlen. Je nachdem, ob ich die Fallauswahl kombiniert oder einzeln eingebe, kommt ein unterschiedliches N heraus.
Hierbei hätte ich ein N von 125:
***Fälle auswählen anhand von Auschlusskriterium T1****
USE ALL.
COMPUTE filter_$=(ibqr_prozent_missing <= .2 ).
VARIABLE LABELS filter_$ 'ibqr_prozent_missing <= .2 (FILTER)'.
VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'.
FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
***Fälle auswählen anhand von Auschlusskriterium T2****
USE ALL.
COMPUTE filter_$=(ecbq_prozent_missing <= .2).
VARIABLE LABELS filter_$ 'ecbq_prozent_missing <= .2 (FILTER)'.
VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'.
FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
Hierbei ein N von 124:
USE ALL.
COMPUTE filter_$=(ibqr_prozent_missing <= .2 AND ecbq_prozent_missing <= .2).
VARIABLE LABELS filter_$ 'ibqr_prozent_missing <= .2 AND ecbq_prozent_missing <= .2 (FILTER)'.
VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'.
FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
Kann mir vielleicht jemand weiterhelfen, welche Syntax korrekt ist und warum es da einen Unterschied zwischen den beiden gibt?
Vielen Dank und viele Grüße
Franzi