Hallo zusammen,
ich beschäftige mich momentan mit einer Regressionsanalyse um den Umsatz eines Unternehmens in Abhängigkeit verschiedener externer Faktoren bestimmen zu können.
Die dazu vorhandenen Daten erstrecken sich über einen Zeitraum von 6 Jahren und wurden von mir zu Quartalswerten aufaddiert. Als unabhängige Variablen habe ich u.a. das Bruttoinlandsprodukt, Anzahl neu entwickelter Modelle innerhalb der Zielbranche, Lieferzeiten, Zulassungszahlen und Indizes zur Markt-/Wirtschaftsentwicklung.
Nun zu meiner ersten Frage:
Soweit ich das sehe/verstehe handelt es sich bei meiner abhängigen Variable um eine Zeitreihe. Dementsprechend ist die Annahme der Unabhängigkeit innerhalb einer Variable verletzt.
Lässt sich dies korrekt "beheben" indem ich SPSS diese Variable auf Autokorrelation prüfe und signifikante Lags als UV einfüge?
Frage Nr. 2:
Ich habe mir Dummyvariablen eingerichtet für die Quartale, da sich dort eine gewisse Saisonalität abzeichnet (bspw. dass Q3 immer am umsatzstärksten ist).
Kann ich diese trotz oder sogar wegen dem Vorliegen einer Zeitreihe ganz normal in meine Regressionsanalyse mit einbeziehen?
Frage Nr. 3:
Da ich teilweise mehr als unsinnige Ergebnisse erhalte, habe ich darüber nachgedacht einige Variablen zu transformieren. Speziell geht es mir dabei um solche wie Umsatz oder BIP, die Zahlenwerte enthalten und eine Zeitreihe sind.
Normalerweise würde ich sagen, dass ich durchaus fähig bin zu Googlen, jedoch konnte ich zu dieser vermeintlich einfachen Frage absolut keine Antwort finden: Macht es Sinn beispielsweise den Umsatz von "absoluten" €-Werten zu relativen, prozentualen Veränderungen zum Vorquartal zu transformieren? Wenn ja, worauf ist dabei zu achten? Sollte dies keinen nennenswerten Vorteil erbringen, hat sich das sowieso erledigt, da mir dadurch ein Quartal verloren gehen würde und ich sowieso schon zu wenig Beobachtungen habe.
Frage Nr. 4:
Bei vielen meiner Variablen lässt sich kein fester und genau definierter Zusammenhang von vorne herein bestimmen. Beispielsweise ist es nicht genau klar, wie sich das BIP auf den Umsatz auswirkt. Damit beziehe ich mich zum Einen auf den Zeitfaktor und zum Anderen auf die Art der Korrelation. Es kann mehrere Monate dauern, bis wir als Zulieferer die Auswirkungen zu spüren bekommen von einer positiven Wirtschaftsentwicklung und ob diese linear auf den Umsatz wirkt ist auch nicht sicher.
SPSS bietet mir hierzu die Kreuzkorrelation um Lead- und Lag-Effekte zu erkennen und die "Curve Estimation" um bspw. auf lineare, logarithmische oder exponentielle Korrelation zu prüfen.
Wie kann ich dies jedoch sinnvoll verwenden? Die Kreuzkorrelation scheint nur auf lineare Zusammenhänge zu prüfen - wenn also tatsächlich etwa ein exponentieller bestehen würde, wäre die Ausgabe irrelevant. Hierzu müsste ich dann erst die Variable transformieren, was jedoch heißen würde ich müsste vorher die Art der Korrelation bestimmen können. Wie kann man dies jedoch machen, wenn man nicht mal weiß ob ein direkter Zusammenhang besteht oder dieser um ein Jahr verschoben ist? Müsste ich dann jetzt z.B. die Lags 1-3 konstruieren und für jeden einzelnen die Curve Estimation laufen lassen?
Da es sich hier auch teilweise um Fragen direkt zu Statistik generell handelt, wurde dieser Beitrag auch im Statistik-Forum gepostet, also bitte nicht wundern.
Vielen Dank schon mal im Voraus!