Verteilungsprüfung

T-Test, U-Test, F-Test sowie weitere Tests und Gruppenvergleiche aller Art mit SPSS.

Verteilungsprüfung

Beitragvon Nils Holgersson » Mo 3. Apr 2017, 18:45

Hallo zusammen,
ich habe paar Fragen bzgl. Verteilungsprüfung.
Also: grundsätzlich bei der Verteilungsprüfung bei n<50 verwendet man Shapiro-Wilk-Test, bei n>50 Kolmogoroff-Smirnov.

1. Da gibt`s 2 Möglichkeiten der Verteilungsprüfung mittels Kolmogoroff-Test in SPSS: 1. durch "Analysieren--Nicht parametrische Tests--K-S bei einer Stichprobe" und 2. durch "Analysieren--Deskriptive statistiken--Explorative Datenanalyse--Normalverteilungsdiagramm mit Tests unter "Diagramme.." einhacken". Beim 1.Verfahren kriegt man in einer Tabelle "reine" p (unter Teststatistik, vorletzte Zeile), wobei in letzter Zeile steht dann getrennt Signifikanzkorrektur nach Lilliefors; beim 2.Verfahren wird p schon mit berechneter Lilliefors-Korrektur dargestellt. Der Unterschied zwischen durch beide Verfahren berechnete p`s ist aber schon kritisch (in einem Fall dtl.<0,05, in anderem >0,05). Welche ist korrekt? Es geht selbstverständlich um dieselbe Stichproben.

2. Es gibt 60 Patienten, bei jedem Patienten wurden dutzende Variablen beurteilt, manche Werte aber fehlen. Bei der Verteilungsprüfung einer der Variablen gibt es tatsächlich 48 Werte, also 12 "missed values". Falls diese "missed values" mitberechnet werden sollen (also als "0" bezeichnet z.B.), dann haben wir n=60 => ist Kolmogoroff-Test zu verwenden. Sollten aber diese "missed values" weggeschmiessen werden, dann n=48 => ist Shapiro-Wilk Test zu benutzen. Ich habe schon beides versucht - Ergebnisse sind aber ganz gegensätzlich (also p>>0,05 und p << 0,05).
Was soll man mit diesen "missed values" machen?...

Danke!
Nils Holgersson
 
Beiträge: 5
Registriert: Mo 3. Apr 2017, 18:18
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Verteilungsprüfung

Beitragvon ponderstibbons » Mo 3. Apr 2017, 21:52

Also: grundsätzlich bei der Verteilungsprüfung bei n<50 verwendet man Shapiro-Wilk-Test, bei n>50 Kolmogoroff-Smirnov.

Grundsätzlich sind inferenzstatistische Verfahren zur Verteilungsprüfung entbehrlich.
In den Stichprobengrößen, wo sie wichtig wären, sind sie zu unsensitiv. In den
Stichprobengrößen, wo sie überflüssig sind, sind sie zu sensitiv. Zudem wird gerne
das Falsche getestet, nämlich die Rohdaten statt die Residuen der gerechneten Verfahren.

Was testest Du hier im konkreten Fall, und zu welchem Zweck?

Der Unterschied zwischen durch beide Verfahren berechnete p`s ist aber schon kritisch (in einem Fall dtl.<0,05, in anderem >0,05).

Bei Prüfung von Voraussetzungen hielt man sich traditionell eher an 0,1 oder Aber 0,15 oder 0,2 als
Signifikanzkriterien. Und dtl <0,05 versus >0,05 ist auch nicht so arg kritisch, das sind halt
willkürliche Grenzwerte. Bei Prüfung von Voraussetzungen ist das Entscheidungsverfahren ohnedies
schwieriger.

2. Es gibt 60 Patienten, bei jedem Patienten wurden dutzende Variablen beurteilt, manche Werte aber fehlen. Bei der Verteilungsprüfung einer der Variablen gibt es tatsächlich 48 Werte, also 12 "missed values". Falls diese "missed values" mitberechnet werden sollen (also als "0" bezeichnet z.B.), dann haben wir n=60 => ist Kolmogoroff-Test zu verwenden. Sollten aber diese "missed values" weggeschmiessen werden, dann n=48 => ist Shapiro-Wilk Test zu benutzen. Ich habe schon beides versucht - Ergebnisse sind aber ganz gegensätzlich (also p>>0,05 und p << 0,05).
Was soll man mit diesen "missed values" machen?...

Wieso interessiert Dich, ob all die Daten aus normalverteilten Grundgesamtheiten stammen?

Mit freundlichen Grüßen

PonderStibbons
ponderstibbons
 
Beiträge: 2523
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 2
Danke bekommen: 257 mal in 256 Posts

Re: Verteilungsprüfung

Beitragvon Nils Holgersson » Mo 3. Apr 2017, 22:58

Vielen Dank für die Antwort :)
Ich glaube, anhand Verteilungstyp (unter anderem) sollte dann der konkrete Test für Analyse ausgewählt werden (Vergleich von verschiedenen Gruppen), sodass es ganz wichtig zu sein scheint. Oder?..

ponderstibbons hat geschrieben:Grundsätzlich sind inferenzstatistische Verfahren zur Verteilungsprüfung entbehrlich.
In den Stichprobengrößen, wo sie wichtig wären, sind sie zu unsensitiv. In den
Stichprobengrößen, wo sie überflüssig sind, sind sie zu sensitiv. Zudem wird gerne
das Falsche getestet, nämlich die Rohdaten statt die Residuen der gerechneten Verfahren.


D.h. auch für kleine Stichproben (z.B.n=20) darf Kolmogorov verwendet werden? Ich wurde anders angelernt - wahrscheinlich aber falsch :)

Vielleicht schenke ich zu viel Aufmerksamkeit dieser Verteilungsprüfung, aber wie anders soll es funktionieren? Wenn Verteilungstyp eigentlich Wurst ist, wozu denn diese Algorythmen mit Testsauswahl, wo 2 Hauptpunkte Verteilungstyp (normal/nicht normal) und Variablentyp (ordinal/nominal usw.) sind?
Nils Holgersson
 
Beiträge: 5
Registriert: Mo 3. Apr 2017, 18:18
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Verteilungsprüfung

Beitragvon ponderstibbons » Di 4. Apr 2017, 08:49

Ich glaube, anhand Verteilungstyp (unter anderem) sollte dann der konkrete Test für Analyse ausgewählt werden (Vergleich von verschiedenen Gruppen), sodass es ganz wichtig zu sein scheint. Oder?..

Nicht dass ich wüsste. Wenn Du die Rohdaten testen willst, dann wäre das wie gesagt ohnedies das Falsche.
D.h. auch für kleine Stichproben (z.B.n=20) darf Kolmogorov verwendet werden? Ich wurde anders angelernt - wahrscheinlich aber falsch :)

Was heißt "dürfen". Dürfen darf man den K-S ohne weiteres, nur gilt der Shapiro-Wilk bei kleinen Stichproben als sensitiver (IIRC).
Vielleicht schenke ich zu viel Aufmerksamkeit dieser Verteilungsprüfung, aber wie anders soll es funktionieren? Wenn Verteilungstyp eigentlich Wurst ist, wozu denn diese Algorythmen mit Testsauswahl, wo 2 Hauptpunkte Verteilungstyp (normal/nicht normal) und Variablentyp (ordinal/nominal usw.) sind?

Das erste ist schlicht Quatsch, falls es um die Verteilung der Variablen der Gesamtstichprobe geht statt um die Verteilung von Vorhersagefehlern bzw. um die Verteilung von Daten innerhalb von Gruppen. Das zweite, das Skalenniveau der abhängigen Variable, ist allerdings immens wichtig.

Mit freundlichen Grüßen

PonderStibbons
ponderstibbons
 
Beiträge: 2523
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 2
Danke bekommen: 257 mal in 256 Posts


Zurück zu Tests und Gruppenvergleiche

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 5 Gäste

cron