Moin an alle,
ich habe vor einigen Tagen den Auftrag von meinem Vorgesetzten bekommen eine Clusteranalyse unerer Daten mittels SPSS durchzuführen.
Ich versuche mir zwar Tag für Tag darüber klar zu werden, was ich genau zu tun habe, letztendlich muss ich mir aber eingestehen, dass ich zu wenig Ahnung habe und Hilfe brauche.
Erstmal: worum geht es?
Wir haben eine Kreuztabelle in Excel erstellt in der verschiedene Personen eigene Bewertungen in Bezug auf die Wahrscheinlichkeit des Eintretens von Szenarien eingetragen haben - und zwar jeweils von 1 (sehr unwahrscheinlich) bis 5 (sehr wahrscheinlich). Die Kreuztabelle ist so aufgebaut, dass man in den Zeilen, ebenso wie in den Spalten die Szenarien 1A,1B,2A,2B,3A,3B etc. stehen hat. Insgesamt beinhaltet die Tabelle 96 Einträge - jeweils horizontal als auch vertikal.
Um die Anzahl der Cluster herauszufinden möchte ich nun zunächst die nearest neighbor-Methode verwenden, um mögliche Ausreißer zu identifizieren, im Anschluss möchte ich die Ward-Methode verwenden, um die Clusteranzahl festzulegen. Ich hoffe das macht soweit Sinn.
Wo ist das Problem?
Sobald ich die nicht vorhandenen Werte (also die Felder in denen Sich die Szenarien kreuzen und entsprechend keine Bewertung erhalten können) in der SPSS als fehlende Werte definiere, beispielsweise mit der Zahl -88 (die -88 definiere ich dann unter Werte als "nicht vorhanden"), gibt mir das Programm die Nachricht aus "Es sind nicht genügend Fälle vorhanden, um die Clusteranalyse durchzuführen".
Ich würde mich sehr freuen, wenn mir jeman helfen könnte dieses Problem zu lösen, wir ihr wahrscheinlich schon herauslesen konntet, bin ich ein Statistik/SPSS-Neuling und es fällt mir noch schwer die Logik dahinter zu verstehen.
Vielen Dank im Voraus
Patrick