Ich werte gerade für meine Abschlussarbeit einen Datensatz aus und bin dabei über folgende Herausforderung gestolpert:
Ich habe 7 Variablen, in denen jeweils die Distanz von einem Firmenstandort A bis zu den Firmenstandorten B, C, D, E, F, G und H niedergeschrieben steht. Die Orte und dementsprechend auch die Distanzen unterscheiden sich von Person zu Person. Außerdem verfügen nicht alle Firmen unbedingt über 8 Standorte und manche Personen haben dementsprechend nur ein, zwei, drei... Distanzen angegeben und die restlichen Felder nicht ausgefüllt (in die leeren Felder habe ich 999 eingefügt und diese als missing value definiert).
Ich möchte nun gerne den Mittelwert der Distanzen errechnen lassen und grundsätzlich geht das ja auch über "Variable berechnen".
Ich habe mir den folgenden Befehl zusammengebastelt: IF (DispB4_b ~= 999) Disp# = (DispB4_b+DispC4_b+DispD4_a+DispE4_b+DispF4_a+DispG4_b+DispH4_b) /(7-Disp_mis).
EXECUTE.
Den MEAN-Befehl habe ich dafür nicht benutzt, da dieser ja erst ab 2 Werten rechnet, ich aber auch im Falle von nur einer vorhandenen Distanz ein Ergebnis haben möchte.
Disp# ist die Ergebnisvariable, die die Mittelwerte beinhalten soll.
DispB4_b ist die Variable mit den ersten Ortdistanzen. Wenn dort eine 999 drin steht, bedeutet das, es gibt weniger als 2 Firmenstandorte und dementsprechend werden diese Fälle für die Berechnung der Mittelwerte ausgeschlossen. So erklärt sich der IF-Befehl.
Die 7 "Disp"-Variablen in der Klammer sind die Variablen mit den einzelnen Ortdistanzen. Für eine Berechnung der Mittelwerte werden sie logischerweise im ersten Schritt aufaddiert.
Die Variable "Disp_mis" beinhaltet die Anzahl der gefundenen '999'-Werte pro Fall in den 7 Disp-Variablen. Wenn also beispielsweise 2 Distanzen angegeben sind, fehlen noch 5 und 7-5 =2, somit wird die Distanzsumme durch die Anzahl der angegebenen Distanzen geteilt.
Da die 999 für alle Variablen als fehlender Wert codiert ist, nehme ich an, dass zum Beispiel bei einer 999 in der Variable DispH4_b diese Variable aus der Formel ausgeschlossen würde, richtig?
Trotzdem bekomme ich in der Ergebnisvariable nur für solche Fälle einen Mittelwert ausgespuckt, in denen 7 Distanzen angegeben sind und alle anderen Felder bleiben leer. Findet hier vielleicht jemand den Fehler, falls man durch meine Erklärung überhaupt durchsteigen kann?

Liebe Grüße und vielen Dank im Voraus
Nina