Hallo ihr Lieben,
ich habe mir -jeweils nach meinen beiden Gruppen (Experimental- vs. Kontrollgruppe) getrennt- die Boxplots zu meinen Variablen angeschaut. Dabei sind mir Ausreißer aufgefallen, die ich durch die Variablenmittelwerte ersetzen will. Dafür möchte ich eine Syntax schreiben, mit der ich aber im Moment nicht weiter komme und bei der mir bisher keiner helfen konnte.
Mein Ansatz wäre folgender.
Es werden Ausreißer, die zwischen 1,5×interquartile range (IQR) und 3×IQR liegen, als „milde“ Ausreißer bezeichnet und Werte,
die über 3×IQR liegen, als „extreme“ Ausreißer. Diese werden von SPSS im Boxplot unterschiedlich gekennzeichnet (Kreis = „milde“ und Stern = „extreme“ Ausreißer).
Ich möchte diejenigen Fälle, die mehr als 1,5xIQR vom Median entfernt liegen, also alle milden und extremen Ausreißer, durch den Mittelwert dieser Variable ersetzen. Manuell ist das nicht möglich (ich habe mehr als 200 Variablen und 42 Fälle). Eine richtige Lösung habe ich bisher noch nicht, da ich mit meinem Ansatz nicht weiter komme. Dieser sieht wie folgt aus:
* Syntax (Beispiel mit der Variable „CSplus_0", also die Häufigkeit der CSplus-Bewegungen in Block 0):
IF ( CSplus_0 > (MEDIAN(CSplus_0) + (1,5 * Interquartilsabstand_Var)) ) CSplus_0 = MEAN(CSplus_0).
IF (CSplus_0 < (MEDIAN(CSplus_0) - (1,5 * Interquartilsabstand_Var)) ) CSplus_0 = MEAN(CSplus_0).
Mein Problem: Ich muss „Interquartilabstand_Var" (der IQR dieser Variable) definieren, es gibt aber keinen Befehl wie „MEDIAN()“ oder „MEAN()“. Und ich muss „CSplus_0“ durch alle Variablennamen ersetzen, sodass alle Variablen vom Programm „abgearbeitet“ werden.
Habt Ihr eine Idee?
Ich würde mich sehr über Hilfe freuen!
Liebe Grüße
Chrissy