Hallo alle zusammen,
ich schreibe meine Bachelorarbeit und führe ein verallgemeinertes lineares gemischtes Regressionsmodell in SPSS (Version 28) mit Count Daten durch.
Forschungsfrage: Welcher Einfluss hat die Bevölkerungsmobilität auf die Covid-19-Inzidenz im Zeitraum von Februar 2020 bis November 2021auf Bundesländerebene in Deutschland.
Um die Wirkung der Bevölkerungsmobilität (unabhängige Variable) auf die Covid-19-Inzidenz (abhängige Variable) zu testen, wurden hierarchische Modelle mit fixed Faktoren verwendet:
1. Mobilitätsvariablen in 6 Orten. (metrisch)
2. kumulative Impfrate (nur zweite Dosis). (metrisch)
3. Jahreszeit (Sommer als Referenzkategorie) (nominal)
und Random Faktoren:
1. Ein Modell mit Tagen Variable (Zeitebene). (metrisch)
2. Zweites Modell mit Bundesländern variabel (jedes Bundesland hat eine Nummer von 1 bis 16) (Ortsebene). (nominal)
3. Drittes Modell mit beiden Tagen und Bundesländern (Zeit- und Ortsebene).
Zuerst habe ich only- Intercept-Modell gebaut, um zu prüfen, welche Art von Regression für die Count Daten besser geeignet ist (Possion oder Negativ binomial) und um die beste Variable als Offset von zwei Variablen auszuwählen. Es zeigte, dass die Negativ binomial Regression ist am besten für diese Daten. (Anhand des BIC oder AIC)
Zweitens habe ich die Kollinearität zwischen den ursprünglichen 6 Mobilitätsvariablen überprüft und ich habe danach Mobilitätsvariablen ausgeschlossen, die basierend auf VIF stark korreliert sind. (Nur eine Variable wurde ausgeschlossen)
Drittens habe ich 7 verallgemeinerte lineare Modelle erstellt, indem ich nur die Fixed Effekte oder Faktoren, die die 5 Mobilitätsvariablen, die kumulative Impfrate Dosis 2 und die Jahreszeit (mit Sommer als Referenzkategorie) sind, schrittweise zum only-Intercept Modell hinzufügte. Aus diesen 7 Modellen wurde das finale Modell mit besten Modellfit ausgewählt.
Schließlich habe ich ein verallgemeinertes lineares gemischtes Modell mit dem obigen finale Modell und einem klassischen random Effekt erstellt, indem ich nur die Variable Days ((Random-Intercept-Komponente für Zeit; Zeitebene)) eingegeben und dann nur die Variable Bundesländer ((Random-Intercept-Komponente für Ort; Ortebene)) eingegeben und schließlich beide zusammen hinzufügen.
Ich bin mir nicht sicher, ob ich den letzten Schritt bezüglich der verallgemeinerten linearen gemischten Modelle richtig ausgeführt habe oder nicht??
Hier sind meine Schritte:
Analysieren-> gemischte Modelle-> verallgemeinertes lineares gemischtes Modell-> Felder und Effekte:
1.Ziel -> cases
Zielverteilung und Beziehung (Verknüpfung) mit dem linearen Modell -> Benutzerdefiniert :
Verteilung -> Negativ Binomial
Verknüpfungsfunktion -> log
2. feste Effekte-> enthalten konstanten Term & 5 Mobilitätsvariablen & kumulative Impfrate & Jahreszeit
3. Zufällige Effekte -> einschließen keinen konstanten Term und Tage variabel (ZEITEBENE)
Kovarianztyp für die zufällige Effekte: Varianzkomponente
4.Gewicht und Offset->Offset-Feld verwenden-> expected cases adjusted wave (log der Variable)
Erstellungsoptionen wie Allgemein und Schätzung bleiben unverändert (empfohlen von SPSS)
Modelloptionen wie geschätzte Mittelwerte bleiben unverändert (vorgeschlagen von SPSS)
Ich habe die gleichen Schritte mit den anderen zwei Modellen durchgeführt, außer mit zufälligen Effekten:
3. Zufällige Effekte ->einschließen keinen konstanten Term und Bundeslandvariable (ORTSEBENE)
3. Zufällige Effekte -> einschließen keinen konstanten Term und Tagen Variable und Bundeslandvariable (ZEIT- & ORTEBENE)
SPSS Output:
1. Die Varianz des zufälligen Effekts der Tagesvariable (Zeitebene) war sehr klein 5.565E-6, was auf einen nur marginalen Effekt im Modell hinweist. (MODELL 1)
2. Die Kovarianz des zufälligen Effekts der Bundesländer war null und die Varianz war 0,079 (Ortsebene) (MODELL 2)
3. Die Varianz des zufälligen Effekts Tagesvariable war sehr klein 4,126E-6 und die Kovarianz des zufälligen Effekts der Bundesländer war Null und die Varianz war 0,060 (Zeit- und Ortsebene) (MODELL 3)
Kann bitte jemand meine Schritte überprüfen und mir erklären, welches Modell von den Modellen im letzten Schritt das beste für die Präsentation der Ergebnisse ist und auch den letzten Punkt in Output innerhalb des Bildes interpretieren?
Vielen lieben Dank für eure Hilfe
LG
Bella