Intracluster-Homogenität testen

Faktoren- und Clusteranalysen, Diskriminanzanalysen und weitere multivariate Verfahren aller Art mit SPSS

Intracluster-Homogenität testen

Beitragvon F_Fi » Do 1. Jun 2017, 10:46

Hallo Zusammen,

ich habe in meiner Abschlussarbeit eine Clusteranalyse (K-Means) mit Clickstreamdaten durchgeführt.
Leider kann ich keine Möglichkeit finden, die Intracluster-Homogenität der z-transformierten und nicht normalverteilten Variablen für die Cluster zu testen.

Hat jemand eine Idee, wie ich dieses Problem in SPSS lösen kann?

Vielen Dank!
F_Fi
 
Beiträge: 4
Registriert: Do 1. Jun 2017, 10:41
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Intracluster-Homogenität testen

Beitragvon strukturmarionette » Sa 3. Jun 2017, 11:26

Hi,

Clusteranalyse (K-Means) mit Clickstreamdaten durchgeführt.

- Was sind das denn für Daten?
- insb auch: Anzahl Vars, Skalenniveaus aller Vars, Stichprobenumfänge, wieviele Cluster und warum?

Gruß
S.
strukturmarionette
 
Beiträge: 2504
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 7
Danke bekommen: 122 mal in 122 Posts

Re: Intracluster-Homogenität testen

Beitragvon F_Fi » Mo 5. Jun 2017, 16:44

Danke für die Rückmeldung.

Ich habe einen Datensatz mit über 150.000 Objekten.
Die Variablen sind sehr unterschiedlich skaliert, als aktive Clustervariablen wurden aber ausschließlich (10) metrische Variablen verwendet (u.a. Anzahl an Klicks bestimmter Seiten im Verhältnis zur Summe der Klicks). Es wurden also Nutzungsaffinitäten für bestimmte Seiten und Funktionen in einem Shop analysiert.

LG
F_Fi
 
Beiträge: 4
Registriert: Do 1. Jun 2017, 10:41
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Intracluster-Homogenität testen

Beitragvon strukturmarionette » Di 6. Jun 2017, 01:58

Hi,

Die Variablen sind sehr unterschiedlich skaliert, als aktive Clustervariablen wurden aber ausschließlich (10) metrische Variablen verwendet

- also 10 Vars (intervallskaliert)? Von insgesamt irgendeiner (welcher?) unbekannten Anzahl Vars?
- was ist mit den anderen?
- wieviele Cluster hast du denn aus den N =150 000 gemacht?

Gruß
S.
strukturmarionette
 
Beiträge: 2504
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 7
Danke bekommen: 122 mal in 122 Posts

Re: Intracluster-Homogenität testen

Beitragvon F_Fi » Mi 7. Jun 2017, 11:04

Hi,

die Variablen sind verhältnisskaliert.
Mir stand eine große Auswahl an Variablen zur Verfügung, die aber eine Interpretation im Rahmen einer sehr kurzen Arbeit unmöglich gemacht hätten.
Daher habe ich zusätzlich zu den aktiven (z-transformierten) Variablen im Nachhinein für einige andere Variablen Mittelwerte angehängt, um die Cluster besser beschreiben zu können.

Das aktuelle Problem liegt aber insbesondere in der Homogenitätsprüfung der 8 Cluster.
Ich habe herausgefunden, das sich über die Verhältnisse der Varianzen durch den F-Wert die Homogenität beurteilen lässt. Ich bin mir aber nicht sicher, ob dieses Verfahren für meinen Fall sinnvoll ist...
Kannst du mir da weiterhelfen?

LG
F_Fi
 
Beiträge: 4
Registriert: Do 1. Jun 2017, 10:41
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Intracluster-Homogenität testen

Beitragvon strukturmarionette » Mi 7. Jun 2017, 15:26

Hi,

Kannst du mir da weiterhelfen?

- Wahrsch nicht.
- Ich kenne nur diesen Alogoritmus, wonach in einem quasi (fast-) endlosen interativen Prozess durch Austauschen die fertigen Cluster immer weiter optimiert werden.
- Einen Signifikanztest, um Deine Cluster auf Homogenität (wobei noch zu spezifizieren wäre, was das bei Dir genau sein soll), kenne ich nicht.
- Möglicherweise gibt es Derartiges fertig aber außerhalb von SPSS.

Gruß
S.
strukturmarionette
 
Beiträge: 2504
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 7
Danke bekommen: 122 mal in 122 Posts

Re: Intracluster-Homogenität testen

Beitragvon F_Fi » Fr 9. Jun 2017, 11:39

Danke trotzdem für die Rückmeldung.

Ich habe nun klassisch einen Vergleich der Varianzen einer Variable innerhalb des Clusters mit der Varianz der Variable in der Stichprobe verglichen.
Ich halte das Verfahren zwar für etwas "streng", da bei den unterschiedlichen Merkmalsausprägungen meiner Stichprobe die Streuungen auch innerhalb der Cluster enorm sind. Aber dieser Lösungsansatz ohne Signifikanzprüfung genügt vorerst.

Gruß, F.
F_Fi
 
Beiträge: 4
Registriert: Do 1. Jun 2017, 10:41
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Multivariate Verfahren

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 3 Gäste

cron