Hallo,
ich arbeite momentan an einer binären logistischen Regression und habe zwei UV, die mir auf verschiedene Art und Weise Probleme bereiten.
1. Sie korrelieren untereinander mit 0,3** (0,01 Niveau) - da ich hier weder Toleranzwert noch VIF (variance inflation factor) berechnen lassen kann, fehlt mir momentan ein Anhaltspunkt, ob das ein Problem darstellt (es handelt sich um die Variablen Alter und Bildungsabschluss, die Korrelation kommt daher, dass - aufgrund der Nachkriegszeit - alte Menschen durchschnittlich über eine geringere Bildung verfügen)
2. Bei der Auswertung der Analyse erhalte ich unterschiedliche Ergebnisse, je nach dem, ob ich Bildung als metrische Variable nutze (Bildungsjahre) oder als nominale (Bildungskategorien nach ISCED) - bei ersteren beträgt der Regressionskoeffizient -,12 (Sig 0,000), bei letzteren sind die Regressionskoeffizienten für alle Kategorien wesentlich höher aber nicht signifikant (0,5 - 0,9) - woran könnte dies liegen?
3. Mein Nagelkerkes R² beträgt im ersten Fall übrigens ,126 (auf der Stufe, wo Bildung aufgenommen wird) und im zweiten Fall ,131 - wie kann ich mir das erklären? Und haltet ihr ein Modell, das einen Erklärungsfaktor auf diesem Niveau (~ 10%) hat, für sinnvoll?
Merci für jegliche Beiträge hierzu