Die Anzahl mit dem höchsten Summenscore bzw. Mittelwert der Items der abhängigen Variable sind 114 Stück bei einer Anzahl von 420 Umfragedaten.
114 Personen haben einen Score von 25 (bzw. falls der Durchschnitt aus den Items gebildet wurde, einen Wert von 5)?
Das würde die Sachlage erklären.
Das Cronbach Alpha ist bei der abhängigen Variable 0.924. Ist da das Problem?
Nein, das ist wünschenswert. Allerdings ist das ein irritierend hoher Wert.
Was kann man da machen oder wäre das mit diesem Deckeneffekt trotzdem hinnehmbar?
Eine mögliche Option wäre, die Stichprobe zweizuteilen (hohe/höchste Zustimmung versus sonstige) und eine
binär-logistische Regression zu rechnen. So eine Zweiteilung sollte aber möglichs auch inhaltlich Sinn ergeben.
Oder Du verwendest sogenannte "robuste Standardfehler", die können in der Prozedur GENLIN (generalized
linear models / Verallgemeinerte lineare Modelle) verwendet werden. Du baust dort Dein Regressionsmodell
wie gehabt zusammen und forderst unter dem Punkt "Schätzer" als Kovarianzmatrix "Robuster Schätzer" an.
(PS: Als eigenen Test habe ich mal alle Umfrageteilnehmer mit sehr hohem Mittelwert(abhängige Variable) ausgeschlossen und die Analyse nur mit so ca 270 Daten (Rest) laufen lassen, dann kommt eine bessere Wolke raus. Die Frage ist aber ob man das natürlich darf?
Das ergibt leider keinerlei Sinn. Ebenso wenig wie eine Streichung von "Ausreißern", sofern diese nicht als
absichtlich oder unabsichtlich fehlerhafte Messungen identifiziert wurden.
Mit freundlichen Grüßen
PonderStibbons