Hallo Forum,
ich habe als Informatiker meiner Freundin zugesagt, Ihr im empirischen Teil Ihrer Arbeit zu helfen - hatte aber bislang recht wenig mit statistischen Verfahren zu tun.
Folgende Probleme:
Wir haben einen Fragebogen erstellt, der folgende Variablen untersuchen soll:
8 Fragen (Rating-Skala), deren Summe F_SUM maximal 24 ergeben kann.
Ein Eintrittsalter in Monaten (metrisch)
Ein aktuelles Alter (Ordinal skaliert) (5;0-5;5).
Die Frage lautet, ob das Eintrittsalter einen Einfluss auf die erreichten Punkte aus den Fragen ergeben. Referenzwerte haben wir aufgrund der Altersklassen des aktuellen Alters.
Die Summe aus den 8 Items ist total links-schief, eine Normalverteilung ist nicht vorhanden. Das Eintrittsalter in Monaten geht von 8 bis 72 Monate, auch kene Normalverteilung. Über eine Klassierung mit SPSS habe ich eine annähernde NV hinbekommen. Wenn meine Hypothese (H0) nun der Art lautet: Das Eintrittsalter hat keinen Einfluss auf die erreichten Punkte, wie verifiziere ich sowas am besten.
Bisher hatte ich mein Eintrittsalter (EA) nach Augenmaß, sinnig eingeteilt (1-jährig, 2-jährig...) Damit habe ich keine Signifikanz hinbekommen. Die Fälle liegen eben auch alle (N=121) im Mittelwert bei ca. 18.
Was ich bereits versucht habe: Normalverteilung zu erreichen mit den gängigen Mitteln (SQRT,LGN...) kein Erfolg. Dann eben ohne Normalverteilung, da Stichprobe nicht soooo klein ist, gehts auch so?!
Meine Idee zu Beginn war, eine Korrelation (Pearson) der metrischen Variablen Eintrittsalter und Punkte. Nicht signifikant, keine NV. Die Kollegen Kedall-Tau und Sperman halfen auch nicht weiter.
Kreuztabelle CHI^2 brachte uns auch nicht wirklich weiter. Gestern habe ich dann das Eintrittsalter einmal anders klassiert und mal nicht gegen Summe der Punkte, sondern gegen die 8 Items aus dem Fragenkatalog auf Korrelation geprüft (hier hatte ich bei manchen Fragen Signifikanz). Freu Das Punkt-/Streudiagramm lässt aber wenig Zusammenhang vermuten (y=19,34-0,01*x) - leider.
Ein weitere Ansatz könnte, so denken wir, der Kruskal-Wallis Test sein. Hier kann ich, mit den klassierten Eintrittsaltrer und der Summe der Punkte die Nullhypothese verwerfen, die Verteilung der Summe ist über die Gruppen nicht gleich. Bei 3 Eintrittsaltergruppen habe ich eine Signifikanz.
So, ich hoffe die Problemstellung ausreichend beschrieben zu haben. Bin ich auf dem richtigen Weg, geht man so was gaaanz anders an? Freue mich über jeden Hinweis oder Tip, haben leider nur noch ne Woche bis zur Abgabe der Arbeit ^^
Danke
Mario