Hallo liebe Mitglieder des Statistik Forums,
Ich muss ein kleinen wenig ausholen sonst macht meine Frage am Ende wenig Sinn.
Also, ich arbeite momentan an einer Projektarbeit zum Thema der Diskriminierung auf dem französischen Arbeitsmarkt. Diese baut auf einer so genannten Korrespondenz-Studie auf. Dh. die Forscher haben im Zuge ihrer Studie fiktive Bewerbungen auf reale Jobausschreibungen versendet, die sich in allem glichen bis auf die Namen der Bewerber. Die Namen wurden quasi benutzt, um die Herkunft des Bewerbers zu signalisieren. Sie waren gleichermaßen Französisch, Nord-Afrikanisch oder ließen sich nicht genau zuordnen. Die Studie hat herausgefunden, dass Bewerber mit ausländischen Namen weniger zurückgerufen (= zum Vorstellungsgespräch eingeladen) wurden als Bewerber mit Französischen Namen. ==> Rückrufrate (angegeben in %)
Und nun komme ich ins Spiel. Da auch innerhalb der Namens-Gruppen unterschiedliche Namen unterschiedlich viele Rückrufe bekamen, wird vermutet, dass Namen nicht nur mit einer Herkunft in Verbindung gebracht werden, sondern eventuell auch mit bestimmten Vorurteile/Characteristica assoziiert sind , die im Berufsleben eine Rolle spielen.
Ich habe einen Fragebogen konzipiert, in dem die Probanden, die Namen die in der Korrenspondenz-Studie verwendet wurde, bezüglich verschiedener Characteristica einschätzen sollten (sozioökomischen Status, Kreativität, Soziale Kompetenz, Arbeitsverhalten und Berufliche Motivation).
- Die Konstrukte wurden mit verschiedenen items abgefragt. Sozioökonomischer Status anhand einer 3-stufen Skala (Hoch, Mittel, Niedrig) und alle anderen Eigenschaften mit einer 9-stufen Skala.
Nun habe ich einen Datensatz mit pro Namen (ich habe insgesamt 6 Namen untersucht) jeweils 50 Werten für jede dieser Variablen.
Dazu habe ich die jeweiligen Rückrufraten aus der Korrespondenzstudie.
Ich möchte gerne wissen, ob der Unterschied in den Rückrufraten durch eine/mehre dieser Variablen mitverursacht wurden (dh. nicht nur die Herkunft eine Auswirkung hatte). Damit dachte ich zunächst an eine Regression. Nun stehe ich aber vor dem Problem, dass ich für die eine Variable pro Namen einen Wert habe (Call-Back rate) und für die anderen Variablen jeweils 50.
Mein Problem ist also (unter anderem) wie ich SPSS verständlich machen kann, dass dieser einer y Wert (zum Namen Lisa) aber zu den und den 50 Werten (beispielsweise der Kreativitätsskala) gehört, während ein anderer, einzelner y Wert (zum Namen Paul) wiederum zu anderen 50 Werten der Kreativitätsskala gehört. Ist so etwas überhaupt möglich? Wie müsste ich die Daten dann sortieren?
Falls das nicht funktioniert, hatte ich gedahct den Mittelwert oder Summenwert dieser Werte für die Variablen zu berechnen, und dann eine normale Regression durchzuführen. Erscheint das sinnvoll für euch? Falls ja, lieber einen Summen anstelle eines Mittelwerts?
Falls das klappen sollte, befinde ich mich dennoch in der Situation, dass ein Attribut wie soziale Kompetenz beispielsweise evt keine Auswirkungen auf die Rückrufrate bei Französischen Namen hat, bei Nord-Afrikanischen Namen aber sehr wohl. Das würde ich durch eine solche Analyse meiner Meinung nicht herausfinden.
Habt ihr Vorschläge? In meinem Kopf hatte sich das zunächst alles sehr gut angehört aber nun wo ich aktiv bei SPSS mal etwas eingeben müsste, bin ich mir auf einmal gar nicht mehr sicher.
Liebe Grüße und Danke im Voraus
Lea