tl;dr: Warum unterscheidet sich das Ergebnis des exakten SPSS Fisher Tests von dem Fisher Test / Chi quadrat Tests, den man online machen kann?
Begrüßung und Experimentbeschreibung
Hallo allerseits,
ich bin ein Neuling im Gebiet Statistk / SPSS und habe ein Problem, bei dem ich mir unsicher bin, wo der Denkfehler ist.
Kommen wir zu einem Beispielexperiment:
Es werden zwei Gruppen untersucht, beide Gruppen umfassen jeweils 15 Personen.
Gruppe A hat einen Zeitungstext gelesen, der in der Schrift Times New Roman geschrieben ist.
Gruppe B hat einen Zeitungstext gelesen, der in der Schrift Comic Sans geschrieben ist.
Es wird untersucht, ob sich die Personen im anschließenden Interview zum Vorhandensein bzw. Nichtvorhandensein der Serifen äußern.
Daraus gibt sich folgende Nominalskalierung:
Variable 1 in SPSS, Gruppe A
Die Gruppe hat sich zum Thema Serifen geäußert
Die Gruppe hat sich nicht zum Thema Serifen geäußert
Variable 2 in SPSS, Gruppe B
Die Gruppe hat sich zum Thema Serifen geäußert
Die Gruppe hat sich nicht zum Thema Serifen geäußert
Dies wird mit 0 (nicht Äußerung) und 1 (Äußerung) codiert.
Datensatz
Daraus ergibt sich folgende Statistik:
A-B
1-0
1-0
1-0
0-1
0-1
0-1
0-1
0-1
0-1
0-1
0-1
0-1
0-1
0-1
0-1ä
Daraus ergibt sich:
Gruppe A hat sich 3x geäußert und 12x nicht geäußert
Gruppe B hat sich 12x geäußert und 3x nicht geäußert
Unterschiede bei der Online-Auswertung und SPSS:
Gebe ich diese Ergebnisse (3-12, 12-3) auf einer der vielen Online-Plattformen ein, bekomme ich folgendes Ergebnis: p = 0.0028 (bei http://graphpad.com/quickcalcs/contingency2.cfm) oder p = 0.002814etc (bei http://vassarstats.net/tab2x2.html). Auch bei anderen Tests der Seite http://www.statpages.org/#CrossTabs komme ich auf das Ergebnis.
Bei SPSS hingegen bekomme ich mit den Rohdaten folgendes Ergebnis:
https://dl.dropbox.com/u/9584865/SPSS-Rohdaten.png
=>die Exakte Signifikanz (2 Seitig) nach Fisher = 1.0
Fragen
Wie kommt dieser Unterschied zu Stande?
Gibt es zwischen 3 Äußerungen in Gruppe A und 12 Äußerungen in Gruppe B tatsächlich keinen signifikanten Unterschied?
Gibt es andere Methoden, mit denen ich eine Signifikanz der Rohdaten nachweisen könnte? Oder bin ich mit Fisher / Chi Quadrat schon an der richtigen Adresse?