Hallo zusammen,
Ich schreibe gerade meine Master-Arbeit und stehe ziemlich auf dem Schlauch. Es geht um den ICC zur Berechnung der Beurteilerübereinstimmung. Und zwar:
- Ich habe ein Kategoriensystem erstellt, dass acht Kategorien umfasst, die Therapeut*innenverhalten in bestimmten Therapiesequenzen beschreiben.
- Zur Überprüfung der Reliabilität haben vier geschulte Rater*innen jeweils 46 Videosequenzen beurteilt. Für jede der acht Kategorien sollte auf einer Skala von 0 bis 3 angegeben werden, wie bedeutsam die jeweilige Kategorie für die Szene ist.
- Ich möchte für jede Kategorie den ICC berechnen, also inwiefern sich die vier Rater*innen in ihrem Urteil einig sind.
- Ich habe hierfür das Modell "zweifach, gemischt" ausgewählt. Außerdem "Absolute Übereinstimmung". Ist das richtig?
- Noch wichtiger: Interpretiere ich beim Output den Wert "Einzelne Maße" oder den Wert "Durchschnittliche Maße"? Ich habe zunächst letzteres interpretiert und war sehr glücklich über meine Ergebnisse. Gestern habe ich dann noch einmal drüber nachgedacht und nun befürchte ich, dass "Einzelne Maße" eigentlich der relevante Wert ist. Ich möchte ja nicht dass der Durchschnitt pro Rater*in über die 46 Weinszenen gebildet wird, sondern dass alle 46 einzeln eingehen. Bin mir aber eben nicht sicher, ob ich das richtig verstanden hab, bzw. was sich hinter "durchschnittliche" und "einzelne" Maße verbirgt.
HILFE! Vielen vielen Dank schon mal.
Liebe Grüße,
Fabienne