Hallo liebe Statistiker,
nach einem Semester Datenanalyse bin ich nicht wirklich tief in die Materie eingedrungen, muss nun aber eine Clusteranalyse durchführen:
Es sollen ca. 100 kurze akustische Meldungen bezüglich ihrer Bedeutung und Aussage klassifiziert werden. Ein Merkmal ist z.B. "Aufgabe" mit den Ausprägungen "Feedback", "Information", "Handlungsempfehlung" und "Warnung".
So habe ich nun 6 Merkmale mit jeweils 3-7 Ausprägungen, nach denen ich die Sounds bewertet habe.
Ich habe gelesen, dass solche nominalen Werte "dummy-codiert" werden müssen, um clusteranalysiert werden zu können. Also habe ich z.B. das Merkmal "Aufgabe" mit den 4 genannten Ausprägungen in n-1 binäre Variablen zerlegt. Durch diese drei lassen sich alle vier Ausprägungen darstellen. Ist das so richtig/sinnvoll? Und wie gewichte ich für SPSS die Merkmale?
Ist hierbei die hierarchische Clusteranalyse mit Single Linkage ratsam um Ausreißer zu finden um anschließend mit der Ward-Methode auf die Klassen zu kommen?
Ich wäre sehr dankbar für Tipps, bzw. ob ich überhaupt auf dem richtigen Dampfer bin. Ideal wäre natürlich eine Schema F Anleitung für den Statistik-Amateur, aber ich bin nicht so frech eine solche zu erwarten
Vielen Dank schon einmal,
Daniel