Kruskal Wallis Test: Relevanz Post-hoc paarweiser Vergleich

T-Test, U-Test, F-Test sowie weitere Tests und Gruppenvergleiche aller Art mit SPSS.

Kruskal Wallis Test: Relevanz Post-hoc paarweiser Vergleich

Beitragvon Lutzmo » Mo 6. Jul 2015, 12:22

Ich habe eine Clusterananlyse hinsichtlich unterschiedlicher Einstellungen und Wertorientierungen (Faktorwerte aus einer Fünf-Faktorlösung) bei 605 Respondents in Indien durchgeführt. Nach erfolgreicher Interpretation der Cluster basierend auf den Faktoren, möchte ich die Cluster nun mit Blick auf andere Variablen, die selbst nicht in die Clusteranalyse mit eingeflossen sind, untersuchen. Dabei geht es vor allem um sozial-demografische Variablen (Einkommen, Alter, Bildung), aber auch um Verhalten und Konsum (ebenfalls in Faktorwerten zusammengefasst).

Um die Cluster daraufhin zu interpretieren und sie miteinander zu vergleichen, habe ich Übersichten mit allen genannten Variablen erstellt. In diesen Übersichten habe ich Mittelwerte, Mediane, Kruskal-Wallis-Werte und T-Werte dargestellt. Zudem habe ich die einzelnen Werte genutzt, um jeweils Ränge zwischen den Clustern zu rechnen. Damit kann ich jetzt z.B. sehen, dass Cluster 1 das geringste Einkommen von allen hat.

Problem ist nun, die Unterschiede auf ihre Signifikanz zu untersuchen. Ich habe bisher keine Literatur gefunden, die dieses Problem ausreichend gründlich beleuchtet. Da fast alle meine Werte nicht normal verteilt sind, bleibt mir nur der Kruskal-Wallis Test. Dieser Test zeigt mir in vielen Fällen zwar insgesamt signifikante Unterschiede. Leider fällt jedoch der Post-Hoc-Test nicht ganz so deutlich aus, das heisst, in der paarweisen Analyse unterscheiden sich nur wenige Cluster signifikant voneinander.

Meine Frage daraufhin:
Kann ich nur jene Cluster miteinander vergleichen, die sich paarweise signifikant voneinander unterscheiden? Oder reicht es vielleicht auch, wenn ich den einfachen Test ohne Post-Hoc paarweiser Analyse angebe?
Sind T-Werte nicht auch normierte Werte, die man für einen Vergleich der Cluster heranziehen kann?

Es wäre toll, wenn jemand einen Rat weiss.
Vielen Dank!
Lutzmo
 
Beiträge: 6
Registriert: Mi 18. Mär 2015, 12:15
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Kruskal Wallis Test: Relevanz Post-hoc paarweiser Vergle

Beitragvon ponderstibbons » Mo 6. Jul 2015, 12:53

Problem ist nun, die Unterschiede auf ihre Signifikanz zu untersuchen. Ich habe bisher keine Literatur gefunden, die dieses Problem ausreichend gründlich beleuchtet. Da fast alle meine Werte nicht normal verteilt sind, bleibt mir nur der Kruskal-Wallis Test.

Diese falsche Annahme scheint unausrottbar zu sein.
Nicht die Variablen sollten "normalverteilt" sein, sondern
die Werte in den Subgruppen, bzw. die Vorhersagefehler
(Residuen) der Varianzanalyse. Und bei großen
Stichproben (N > 600 sollte da sicher ausreichen) ist
die Varianzanalyse robust gegenüber nicht-Normalität.
Relevanter ist Varianzhomogenität, v.a. wenn die Gruppen
deutlich unterschiedlich groß sein sollten.
Leider fällt jedoch der Post-Hoc-Test nicht ganz so deutlich aus, das heisst, in der paarweisen Analyse unterscheiden sich nur wenige Cluster signifikant voneinander.

Das bleibt nicht aus. Leider ist die Zahl der Cluster nicht
genannt und nicht die Methde beim post-hoc Test.
Kann ich nur jene Cluster miteinander vergleichen, die sich paarweise signifikant voneinander unterscheiden?

Das ist doch bereits erledigt.
Oder reicht es vielleicht auch, wenn ich den einfachen Test ohne Post-Hoc paarweiser Analyse angebe?

Reichen für welchen Zweck?
Sind T-Werte nicht auch normierte Werte, die man für einen Vergleich der Cluster heranziehen kann?

Was meinst Du damit?

Mit freundlichen Grüßen

P.
ponderstibbons
 
Beiträge: 2523
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 2
Danke bekommen: 257 mal in 256 Posts

Re: Kruskal Wallis Test: Relevanz Post-hoc paarweiser Vergle

Beitragvon Lutzmo » Mo 6. Jul 2015, 14:28

Vielen Dank für die wertvollen Fragen! Allerdings bringt mich das noch nicht weiter. Hier versuche ich zunächst Deine Fragen zu beantworten:
- Die Cluster sind in sich nicht normalverteilt
- Es handelt sich um 6 unterschiedlich große Cluster (ich habe vergessen zu erwähnen, dass insgesamt nur 417 Fälle in die Clusteranalyse eingeflossen sind)
- Die Größe der Cluster variiert zwischen 40 und 110
- Die Posthoc Methode wurde im Rahmen der neuen SPSS 21 Kruskal Wallis Analyse durchgeführt und gibt den ModelViewer mit paarweisen Vergleichen aus
- Meine Frage, ob der einfache Kruskal-Wallis Test ohne Posthoc Analyse ausreicht, um die Cluster anhand verschiedener Variablen miteinander zu vergleichen, wenn der Kruskal Wallis Test doch eigentlich signifikant ausfiel.
Lutzmo
 
Beiträge: 6
Registriert: Mi 18. Mär 2015, 12:15
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Kruskal Wallis Test: Relevanz Post-hoc paarweiser Vergle

Beitragvon ponderstibbons » Mo 6. Jul 2015, 23:10

- Die Posthoc Methode wurde im Rahmen der neuen SPSS 21 Kruskal Wallis Analyse durchgeführt und gibt den ModelViewer mit paarweisen Vergleichen aus

Als Gutacher würde ich dann fragen, was die Software denn da
konkret gemacht hat.
- Meine Frage, ob der einfache Kruskal-Wallis Test ohne Posthoc Analyse ausreicht, um die Cluster anhand verschiedener Variablen miteinander zu vergleichen, wenn der Kruskal Wallis Test doch eigentlich signifikant ausfiel.

Der Globaltest gibt Auskunft darüber, dass die Gruppen (Cluster) nicht
alle gleich sind. Die paarweisen Vergleiche (post-hoc-Tests)
geben Auskunft darüber, genau welche Gruppen sich signifikant
voneinander unterscheiden. Ohne post-hoc-Tests sind diese letzeren
Aussagen nicht möglich, zumal bei ungleichen Gruppengrößen.

Wie gesagt, wäre eine einfaktorielle Varianzanalye naheliegend,
da die Gesamtstichprobe ausreichend groß ist, um sich mit
Normalverteilungsfragen nicht allzu sehr befassen zu müssen.

Die zur Verfügung stehenden post-hoc Tests für die einfaktorielle
Varianzanalyse sind dann sogar namentlich bekannt, was bei
wissenschaftlichen Datenanalysen ja nicht unangenehm ist.

Für ungleiche Varianzen gibt es in SPSS auch entsprechend korrigierte
einfaktorielle Varianzanalysen.

Mit freundlichen Grüßen

P.
ponderstibbons
 
Beiträge: 2523
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 2
Danke bekommen: 257 mal in 256 Posts

Re: Kruskal Wallis Test: Relevanz Post-hoc paarweiser Vergle

Beitragvon Lutzmo » Do 9. Jul 2015, 15:47

ponderstibbons hat geschrieben:Wie gesagt, wäre eine einfaktorielle Varianzanalye naheliegend,
da die Gesamtstichprobe ausreichend groß ist, um sich mit
Normalverteilungsfragen nicht allzu sehr befassen zu müssen.

Die zur Verfügung stehenden post-hoc Tests für die einfaktorielle
Varianzanalyse sind dann sogar namentlich bekannt, was bei
wissenschaftlichen Datenanalysen ja nicht unangenehm ist.

Für ungleiche Varianzen gibt es in SPSS auch entsprechend korrigierte
einfaktorielle Varianzanalysen.

P.


Vielen Dank nochmals! Aber ich möchte gerne sicher gehen: In verschiedenen Lehrbüchern steht, dass bei nicht normalverteilten Werten (das ist bei mir der Fall), auf nichtparametrische Tests zurückgegriffen werden sollte. Weil ich mehrere unabhängige Gruppen vergleichen möchte, habe ich den Kruskal-Wallis Test gewählt.

Wenn ich in SPSS 22 die neue Variante über den Model Viewer wähle (das Verfahren wird dort als Kruskal-Wallis 1-way ANOVA (k-samples) benannt), dann werden alle Gruppen paarweise miteinander verglichen. Der Nachteil dabei ist, dass durch Bonferroni Adjustment (p-Wert / number of tests = critical value) der p-Wert zu klein und der Test zu restriktiv wird.
Am Ende kann ich kaum Aussagen treffen über z.B. Alter, Einkommen, Wohlstand, weil sich bei 6 Clustern für jede Variable nur zwei drei Paare (von 15 möglichen) signifikant unterscheiden.

Macht es eventuell mehr Sinn, jeden Cluster einzeln mit dem Rest des Samples zu vergleichen und seine Abweichung vom Rest auf signifikante Unterschiede hin zu untersuchen?
Vielen Dank schon mal im Voraus!
Lutzmo
 
Beiträge: 6
Registriert: Mi 18. Mär 2015, 12:15
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Kruskal Wallis Test: Relevanz Post-hoc paarweiser Vergle

Beitragvon ponderstibbons » Do 9. Jul 2015, 16:07

In verschiedenen Lehrbüchern steht, dass bei nicht normalverteilten Werten (das ist bei mir der Fall), auf nichtparametrische Tests zurückgegriffen werden sollte.

Welche Lehrbücher verbreiten diesen Unfug? Schmeiße sie weg und beschaffe Dir
brauchbare. Nicht die Werte sollen normalverteilt sein, sondern die in den Gruppen,
bzw. die Vorhersagefehler (Residuen) des Modells. Und bei ausreichender
Stichprobengröße stellt der zentrale Grenzwertsatz sicher, dass
die Ergebnisse auch dann zuverlässig sind, wenn die Residuen nicht-normal sind.
Daher sind hier varianzanalytische Verfahren angebracht.

Macht es eventuell mehr Sinn, jeden Cluster einzeln mit dem Rest des Samples zu vergleichen und seine Abweichung vom Rest auf signifikante Unterschiede hin zu untersuchen?

Nein.

Mit freundlichen Grüßen

P.
ponderstibbons
 
Beiträge: 2523
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 2
Danke bekommen: 257 mal in 256 Posts


Zurück zu Tests und Gruppenvergleiche

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 17 Gäste

cron