Clusteranalyse mit nominalen Daten

Faktoren- und Clusteranalysen, Diskriminanzanalysen und weitere multivariate Verfahren aller Art mit SPSS

Clusteranalyse mit nominalen Daten

Beitragvon ChrisSaar96 » Mi 14. Dez 2022, 22:03

Hallo in die Runde,

im Rahmen meiner Masterarbeit würde ich gerne eine Clusteranalyse mit mehreren (ca. 8) nominalen Variablen (alle für sich genommen nicht dichotom - also mehr als 2 Ausprägungen je Variable) machen. Da meine Statistik-Kenntnisse leider sehr spärlich sind, habe ich dazu leider noch einige Fragen :oops: :

Sind alle drei in SPPS verfügbaren Clustermethoden (Hierarchisch, K-Means, Two-Step-Cluster) prinzipiell für einen Datensatz mit ca. 150 Fällen geeignet?

Welche Einstellungen müssen bei der hierarchischen Clustermethode vorgenommen werden?
--> konkret: SPSS muss die nominalskalierten Daten ja zu Binärdaten umwandeln. Geschieht dies automatisch sobald ich als Maß "binär" anklicke (quasi im Hintergrund), oder muss ich die Maße im Menüfenster durch Anklicken von "Auf Bereiche 0-1 skalieren" transformieren, oder aber muss dies zuvor gar manuell durchs Bilden einer manuellen Dummy-Variable geschehen?
Screenshot 2022-12-14 205248.png
Hier das SPSS-Fenster zur Hierarchischen Clusteranalyse
Screenshot 2022-12-14 205248.png (91.52 KiB) 4641-mal betrachtet


Wäre für jegliche Ratschläge super dankbar!
ChrisSaar96
 
Beiträge: 3
Registriert: Mi 14. Dez 2022, 21:37
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Clusteranalyse mit nominalen Daten

Beitragvon ChrisSaar96 » Mi 14. Dez 2022, 22:18

Screenshot2.png
Screenshot2.png (99.09 KiB) 4638-mal betrachtet

Oder aber muss die Codiuerung in Binäre Variablen über das Auswahlfeld "Standardisieren" erfolgen?
ChrisSaar96
 
Beiträge: 3
Registriert: Mi 14. Dez 2022, 21:37
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Clusteranalyse mit nominalen Daten

Beitragvon ponderstibbons » Do 15. Dez 2022, 08:47

Die Stichprobengröße sollte kein Problem darstellen.
Kategoriale Variablen werden durch die Prozedur nicht in eine Reihe von binären Variablen umgewandelt. Diese muss der Nutzer gegebenenfalls selbst anlegen.
Was die möglichen Skalenniveaus der Daten in den drei Prozeduren angeht, siehe Handbuch:
https://www.ibm.com/docs/de/spss-statis ... r-analysis
https://www.ibm.com/docs/de/spss-statis ... r-analysis
https://www.ibm.com/docs/de/spss-statis ... r-analysis

Mit freundlichen Grüßen

PonderStibbons
ponderstibbons
 
Beiträge: 2523
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 2
Danke bekommen: 257 mal in 256 Posts

Re: Clusteranalyse mit nominalen Daten

Beitragvon ChrisSaar96 » Do 15. Dez 2022, 10:30

Danke für hilfreiche Antwort!

In "Backhaus Multivariate Analysemethoden" habe ich gelesen, dass auch ohne Binär-Codierung geclustert werden kann (siehe Bild). Wissen Sie, oder sonst jemand in der Runde, wann (bei Verwendung dieses Verfahrens) auf Werte zwischen 0 und 1 standartisiert bzw. auf den Bereich zwischen 0-1 transformiert werden muss?
Screenshot3.png
Screenshot3.png (97.86 KiB) 4617-mal betrachtet
ChrisSaar96
 
Beiträge: 3
Registriert: Mi 14. Dez 2022, 21:37
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Clusteranalyse mit nominalen Daten

Beitragvon ponderstibbons » Do 15. Dez 2022, 11:55

Das Chi²-Maß bezieht sich auf Zähldaten. Und die Transformation hat nichts mit binären Variablen zu tun. Es handelt sich
bei "Werte transformieren" um Möglichkeiten zur Transformation von Intervalldaten, um verschieden skalierte Variablen
(z.B. "Gewicht 45 bis 187 kg" und "Schuhgröße 37 bis 47 cm") vergleichbar zu machen, weil sonst Variablen mit numerisch
"breiten" Skalen die Distanzmessungen dominieren. "Maße transformieren" ist eine Re-Skalierung der berechneten
Distanzen.

Mit freundlichen Grüßen

PonderStibbons
ponderstibbons
 
Beiträge: 2523
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 2
Danke bekommen: 257 mal in 256 Posts


Zurück zu Multivariate Verfahren

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 3 Gäste

cron