Hallo,
ich rechne eine multiple Regression.
Ich habe eine kategoriale UV (depression ja vs. nein) und eine metrische (Summe einer Skala).
Nun habe ich noch eine Reihe von Kontrollvariablen (15), die ich zusätzlich in die Regression einbeziehe. Darunter sind einige Dummyvariablen, da es sich bei einigen Kontrollvariablen um kategoriale Variablen handelt.
Ausreißer möchte ich folgendermaßen identifizieren: Multivariate Ausreißer anhand der Hebelwerte, Grenzwerte errechnet durch (2 k + 2)/n mit k = Anzahl der UVs und n = Zahl der Fälle (Williams, 2016). Bei kleinen Stichproben soll 3k/n ein besserer Grenzwert sein laut Belsley et al., 1980, bei größeren Stichproben 2 k/n. Wer weiß was mit kleiner bzw. größerer Stichprobe gemeint ist?
Und wie kann ich Ausreißer in den Dummy-Variablen feststellen?
Ich danke für eure Hilfe!