Normalverteilung der Variablen erreichen

Regressionsmodelle aller Art mit SPSS.

Normalverteilung der Variablen erreichen

Beitragvon nb94 » Mi 9. Okt 2019, 16:25

Hallo Zusammen,


ich untersuche den Zusammenhang zwischen social Media Nutzungsdauer (in Minuten) und dem Selbstwert bei Jugendlichen im alter zwischen 12-20 Jahren
(Alter und Nutzungsdauer: metrisch, Selbstwert: quasi metrisch)

hier möchte ich auch genauer betrachten welche alterssprezifischen unterschiede es gibt.
Die Dauer der Nutzung soll hier der Moderator sein.

Nun ist meine Stichprobe (N=170) in den Variablen alter und Nutzungsdauer nicht normalverteilt.
(Die Normalverteilung ist aber die Vorraussetzung für viele meiner Tests)

Ich habe versucht, die Nutzungsdauer zu logarithmieren, nach der erneuten Betrachtung des Q-Q Diagrammes und des Kolmogorov Smirnoff tests ist die Verteilung immer noch nicht optimal.

Eine weitere Option wäre der Ausschluss der Ausreißer, allerdings ist mir nicht ganz klar, wo ich hier die Grenze ziehen darf ?
-> so viele Ausreißer ausschließen, bis die Normalverteilung erreicht ist?
-> Lösche ich diese Fälle dann komplett aus meinem Datensatz?

ich habe auch gelesen, dass Boxplotten eine Option wäre,
-> allerdings weiß ich nicht, ob dies auch bei einer Moderation möglich ist
-> Die Moderation würde ich mit dem Process Plugin in SPSS rechnen.


Zuletzt stellt sich noch die Frage, ob es einen nicht-parametrischen Test gibt, um die moderation zu rechnen.


Vielen Dank schonmal :)
nb94
 
Beiträge: 2
Registriert: Mi 3. Jul 2019, 22:24
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Normalverteilung der Variablen erreichen

Beitragvon ponderstibbons » Mi 9. Okt 2019, 16:51

Nun ist meine Stichprobe (N=170) in den Variablen alter und Nutzungsdauer nicht normalverteilt.
(Die Normalverteilung ist aber die Vorraussetzung für viele meiner Tests)

Das ist unzutreffend. Wer hat Dir das eingeredet? Eine "Normalverteilung" von Ausgangsvariablen ist allenfalls bei der Testung von Pearson-Korrelationen gefragt. Bei Analysen im Rahmen des allgemeinen linearen Modells (Regression, Varianzanalyse etc.) kann allenfalls die Verteilung der Modellfehler (Residuen) von Interesse sein, aber auch das nur bei kleinen Stichproben (ca. n < 30). Bei größeren Stichproben sind die Verfahren auch gegen nichtnormal verteilte Residuen robust. Und die Verteilung von Prädiktoren oder Moderatoren ist sowieso überhaupt nicht von Belang.

Mit freundlichen Grüßen

PonderStibbons
ponderstibbons
 
Beiträge: 2523
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 2
Danke bekommen: 257 mal in 256 Posts

Re: Normalverteilung der Variablen erreichen

Beitragvon nb94 » Di 15. Okt 2019, 02:06

Hallo :)

Vielen Dank für die Antwort, ich hatte etwas missverstanden.

Ich habe nun versucht die Regression zu rechnen.
Allerdings konnte ich schon die Linearitätsvoraussetzung nicht erfüllen -> deshalb habe ich eine log transformation der UV durchgeführt.
- Im Anschluss habe ich erneut mittels eines Streudiagramms die Linearität von UV und AV getestet und nun ist diese Voraussetzung für die einfache lineare Regression erfüllt.

Als nächstes habe ich mit der log transformierten Variable weitergerechnet udn weitere Voraussetzungen (Normalverteilung der Residuen, Homoskedastizität geprüft) -> auch diese Voraussetzungen sind nun erfüllt.

Deshalb konnte ich meines wissens die Regression ohne weitere Probleme durchführen

Meine Hypothese erwies sich als signifikant, allerdings erklärt das Modell den Zusammnehang nur gerinfügig.

Ich frage mich nun, wie ich die Ergebnisse richtig berichte?

Insbesondere in anbetracht der Transformierten Variable da diese ja nun nicht mehr die richitge Einheit wiedergibt

Ich hoffe man versteht was ich meine.

Vielen Dank
nb94
 
Beiträge: 2
Registriert: Mi 3. Jul 2019, 22:24
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Normalverteilung der Variablen erreichen

Beitragvon strukturmarionette » Di 15. Okt 2019, 12:06

Hi,

Meine Hypothese erwies sich als signifikant, allerdings erklärt das Modell den Zusammnehang nur gerinfügig.

- Wie lautet diese bei Deinen N =170 konkret, auf die Du Dich mit Deiner Feststellung an dieser Stelle beziehst.

Ich frage mich nun, wie ich die Ergebnisse richtig berichte?

- Welche Ergebnisse meinst Du konkret?
- Statistisch oder fachlich /inhaltlich berichte?

Gruß
S.
strukturmarionette
 
Beiträge: 2504
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 7
Danke bekommen: 122 mal in 122 Posts


Zurück zu Regressionsmodelle

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 0 Gäste

cron