Korrelation zwischen kategorialer und metrischer Variable

Pearson, Spearman und co., Korrelationsanalysen aller Art mit SPSS.

Korrelation zwischen kategorialer und metrischer Variable

Beitragvon pomke » So 23. Apr 2017, 12:28

Hallo,

ich untersuche gerade im Rahmen meiner medizinischen Doktorarbeit den Zusammenhang verschiedener Faktoren auf die Lebensqualität (metrisch skaliert).

Diese Faktoren sind zum großen Teil metrisch oder dichotom (Geschlecht, Krankheit mild/schwer etc.) skaliert. Eine der Variablen besteht jedoch aus drei Kategorien (Krankheitsgruppen). Jetzt ist die Frage, wie ich mit dieser kategorialen Variable Korrelationen berechnen kann. Also die Erkrankungsgruppe mit den anderen Faktoren und mit dem Outcome.
Kann ich den Eta-Wert berechnen lassen und diesen wie den Korrelationskoeffizienten r behandeln? Leider spuckt SPSS dazu keine Signifikanz aus, sodass die Interpretation schwierig ist.
Zwischen meine Faktoren gibt es leider auch signifikante Korrelationen, wie gehe ich damit um?

Geplant war ursprünglich eine multiple lineare Regression mit allen Faktoren zu rechnen. Jedoch funktioniert dies ja mit der kategorialen Variable nicht. Dummy-Variablen sind keine Option, da ich ja die einzelnen Krankheitsgruppen auftrennen will und nicht zwei zusammengefasst gegen eine vergleichen kann/will.
Meine Betreuerin hat jetzt eine Varianzanalyse (ANCOVA) vorgeschlagen. Dort kann ich die Erkrankgungsgruppen dann als festen Faktor angeben und alle anderen Variablen als Kovariaten. Kann ich dann noch den Einfluss der einzelnen Variablen wie in der multiplen Regression vergleichen?

Ich bin gerade wirklich am verzweifeln und würde mich über Hilfe und Anregungen sehr freuen. Vielen Dank schon mal und LG!
pomke
 
Beiträge: 4
Registriert: So 23. Apr 2017, 12:14
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Korrelation zwischen kategorialer und metrischer Variabl

Beitragvon strukturmarionette » So 23. Apr 2017, 13:48

Hi,

Ich bin gerade wirklich am verzweifeln

- dann wäre wohl vorab (bevor mit einer Statistiksoftware rumprobiert wird) ein seriöses Lehrbuch 'Multivariate Statistik' zu recipieren.

Gruß
S.
strukturmarionette
 
Beiträge: 2504
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 7
Danke bekommen: 122 mal in 122 Posts

Re: Korrelation zwischen kategorialer und metrischer Variabl

Beitragvon ponderstibbons » So 23. Apr 2017, 14:56

Zwischen meine Faktoren gibt es leider auch signifikante Korrelationen, wie gehe ich damit um?

Was meinst Du damit?

Und wie sieht überhaupt Dein Konzept aus, Du machst einen Serie von bivariaten Analysen?
Geplant war ursprünglich eine multiple lineare Regression mit allen Faktoren zu rechnen. Jedoch funktioniert dies ja mit der kategorialen Variable nicht.

Für eine kategoriale Variable mit k Stufen werden für die Regression k-1 dummy-Variablen
erzeugt (eine Stufe bekommt keine eigene Variable, weil das redundant wäre, das ist dann
die Referenzgruppe).
Kann ich dann noch den Einfluss der einzelnen Variablen wie in der multiplen Regression vergleichen?

Du scheinst der irrigen Annahme zu sein, dass man einfach die Koeffizienten
aus verschiedenen Analysen bzw. aus den Ergebnissen einer multipen Regression
nebeneinander stellen und dann daraus unmittlbare Schlüsse ziehen kann.

Wieviele Variablen wurden erhoben und wie groß ist die Stichprobe?

LG!

wtf

Mit freundlichen Grüßen

PonderStibbons
ponderstibbons
 
Beiträge: 2523
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 2
Danke bekommen: 257 mal in 256 Posts

Re: Korrelation zwischen kategorialer und metrischer Variabl

Beitragvon pomke » So 23. Apr 2017, 15:11

Also vielleicht mal kurz zu meinem Studiendesign. Ich habe 190 Jugendliche befragt, die Aufteilung auf die Krankheitsgruppen ist 30 - 30 - 130. Ich habe verschiedene Skalen wie Familienklima, soziale Unterstützung (alle metrisch) und auch dichotome Variablen wie Geschlecht, Krankheitsschwere und Medikamentenadhärenz. Mein Outcome ist die Lebensqualität, die in fünf verschiedene Dimensionen eingeteilt wurde (auch metrisch). Für jede Dimension möchte ich eine eigene Analyse machen, um zu gucken, welche Prädiktoren einen Einfluss darauf haben und wie stark dieser ist. Also dass z.B. die soziale Unterstützung den größten Einfluss auf die emotionale Lebensqualität hat o.Ä.
Ursprünglich war der Plan eine multiple lineare Regression für jede Dimension zu rechnen. Da ein Prädiktor aber die Erkrankungsgruppe mit drei Ausprägungen ist, bliebe da nur die Dummy-Kodierung. Jetzt sagte mir der Statistiker, dass dies so nicht möglich sei, da ich entweder dann nur zwei Gruppen miteinander vergleichen könnte und die andere dann wegfallen würde, also Gruppe A gegen Gruppe B. Oder eben zwei Gruppen zusammengefasst werden, sodass man dann den Zusammenhang nicht auswerten kann. Also Gruppe A+B im Vergleich zu Gruppe C. Wenn ich jetzt zwei Dummys mit in die Regression aufnehme also Gruppe A = 1, B und C = 0 sowie B = 1, A und C = 0, wie kann ich das Ergebnis dann interpretieren? Ich habe dann ja auch noch die ganzen anderen Prädiktoren mit in der Regression, wie erkenne ich dann den einzelnen Effekt von bspw. Gruppe A? Ist denn eine ANCOVA eine Alternative zur multiplen linearen Regression?

Ich möchte nicht die einzelnen Regressionen untereinander vergleichen. Also nicht Prädiktor x ist in Regression 1 höher als in Regression 2, sondern nur innerhalb der Regression sagen können, welche Prädiktoren den größten Einfluss auf das Outcome haben.

Mit der Korrelation innerhalb der Variablen meinte ich, dass z.B. Alter und Geschlecht signifikant miteinander korrelieren oder z.B. Familienklima und Krankheitskontrolle. Dies sollte doch für die Regression nicht sein oder habe ich das falsch verstanden? Und kann ich den Eta-Wert mit dem Pearson-Korrelationskoeffizienten vergleichen? Ich möchte z.B. eine Korrelation zwischen Erkrankungsgruppe und einer Lebensqualitätsdimension oder zwischen Erkrankungsgruppe und einem anderen Prädiktor bestimmen.


Ich hoffe, dass das Problem jetzt ein bisschen klarer geworden ist.

Freundliche Grüße,

pomke
pomke
 
Beiträge: 4
Registriert: So 23. Apr 2017, 12:14
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Korrelation zwischen kategorialer und metrischer Variabl

Beitragvon ponderstibbons » So 23. Apr 2017, 16:52

Jetzt sagte mir der Statistiker, dass dies so nicht möglich sei, da ich entweder dann nur zwei Gruppen miteinander vergleichen könnte und die andere dann wegfallen würde, also Gruppe A gegen Gruppe B. Oder eben zwei Gruppen zusammengefasst werden, sodass man dann den Zusammenhang nicht auswerten kann.

Wie man es in einer multiplen Regression bei eine k-stufigen Variable macht, habe ich ja bereits geschrieben.

Also Gruppe A+B im Vergleich zu Gruppe C. Wenn ich jetzt zwei Dummys mit in die Regression aufnehme also Gruppe A = 1, B und C = 0 sowie B = 1, A und C = 0, wie kann ich das Ergebnis dann interpretieren?

Du hast 3 dummies angegeben. Bei einer 3stufigen Variable werden nur 2 Dummies benötigt. Interpretieren kannst Du den Effekt einer Kategorie relativ zur Referenzkategorie. Welche Kategorie die Referenzkategorie ist (die keine eigene Dummy-Variable erhält), bleibt dem Untersucher überlassen.
Ist denn eine ANCOVA eine Alternative zur multiplen linearen Regression?

Das ist im Prinzip genau dasselbe . Aber Du hattest nach Regression gefragt.
Ich möchte nicht die einzelnen Regressionen untereinander vergleichen. Also nicht Prädiktor x ist in Regression 1 höher als in Regression 2, sondern nur innerhalb der Regression sagen können, welche Prädiktoren den größten Einfluss auf das Outcome haben.

Das ist mir schon klar, aber da die Prädktoren miteinander korreliert sind, kann
man nicht einfach die Höhen miteinander vergleichen, noch dazu ohne formalen
Test. S.z.B.
http://files.eric.ed.gov/fulltext/EJ863505.pdf Seite 15 ff., oder
http://journals.sagepub.com/doi/abs/10. ... 8104266510
- um mal aufzuzeigen, dass das alles doch etwas schwieriger ist.
Und SPSS hat keine Lösungen dafür.

Mit der Korrelation innerhalb der Variablen meinte ich, dass z.B. Alter und Geschlecht signifikant miteinander korrelieren oder z.B. Familienklima und Krankheitskontrolle. Dies sollte doch für die Regression nicht sein oder habe ich das falsch verstanden?

Falsch verstanden.
ponderstibbons
 
Beiträge: 2523
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 2
Danke bekommen: 257 mal in 256 Posts

folgende User möchten sich bei ponderstibbons bedanken:
pomke

Re: Korrelation zwischen kategorialer und metrischer Variabl

Beitragvon pomke » Di 25. Apr 2017, 13:40

Hallo,

ich bin jetzt schon ein bisschen voran gekommen. Die Prädiktoren korrelieren nur leicht untereinander, es liegt also keine Multikollinearität vor.

In Absprache mit meiner Betreuerin rechne ich jetzt eine ANCOVA mit der Erkrankungsgruppe als festen Faktor und allen anderen Prädiktoren als Kovariaten. Abhängige Variable ist eine Dimension der Lebensqualität.

Jetzt ist bei der ersten Dimension leider ein Problem aufgetreten, da der Levene Test signifikant wurde (0,023). Somit darf ich die Ergebnisse der ANCOVA nicht interpretieren oder? Wie ist jetzt das richtige Vorgehen? In den vier anderen Lebensqualitätsdimensionen wird der Levene Test nicht signifikant.

Noch eine weitere Frage: nehme ich nur Kovariaten mit in die ANCOVA, die signifikant mit der AV (Lebensqualität) korrelieren oder kann ich einfach alle Prädiktoren in jede ANCOVA stecken auch wenn ich vorher keine Korrelation finden konnte, diese aber aufgrund meiner Literaturrecherche untersuchen wollte?

Danke und freundliche Grüße,

pomke
pomke
 
Beiträge: 4
Registriert: So 23. Apr 2017, 12:14
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post


Zurück zu Korrelationen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 6 Gäste

cron