Ich habe eine Clusterananlyse hinsichtlich unterschiedlicher Einstellungen und Wertorientierungen (Faktorwerte aus einer Fünf-Faktorlösung) bei 605 Respondents in Indien durchgeführt. Nach erfolgreicher Interpretation der Cluster basierend auf den Faktoren, möchte ich die Cluster nun mit Blick auf andere Variablen, die selbst nicht in die Clusteranalyse mit eingeflossen sind, untersuchen. Dabei geht es vor allem um sozial-demografische Variablen (Einkommen, Alter, Bildung), aber auch um Verhalten und Konsum (ebenfalls in Faktorwerten zusammengefasst).
Um die Cluster daraufhin zu interpretieren und sie miteinander zu vergleichen, habe ich Übersichten mit allen genannten Variablen erstellt. In diesen Übersichten habe ich Mittelwerte, Mediane, Kruskal-Wallis-Werte und T-Werte dargestellt. Zudem habe ich die einzelnen Werte genutzt, um jeweils Ränge zwischen den Clustern zu rechnen. Damit kann ich jetzt z.B. sehen, dass Cluster 1 das geringste Einkommen von allen hat.
Problem ist nun, die Unterschiede auf ihre Signifikanz zu untersuchen. Ich habe bisher keine Literatur gefunden, die dieses Problem ausreichend gründlich beleuchtet. Da fast alle meine Werte nicht normal verteilt sind, bleibt mir nur der Kruskal-Wallis Test. Dieser Test zeigt mir in vielen Fällen zwar insgesamt signifikante Unterschiede. Leider fällt jedoch der Post-Hoc-Test nicht ganz so deutlich aus, das heisst, in der paarweisen Analyse unterscheiden sich nur wenige Cluster signifikant voneinander.
Meine Frage daraufhin:
Kann ich nur jene Cluster miteinander vergleichen, die sich paarweise signifikant voneinander unterscheiden? Oder reicht es vielleicht auch, wenn ich den einfachen Test ohne Post-Hoc paarweiser Analyse angebe?
Sind T-Werte nicht auch normierte Werte, die man für einen Vergleich der Cluster heranziehen kann?
Es wäre toll, wenn jemand einen Rat weiss.
Vielen Dank!