Hallo Zusammen,
ich hätte da, eine evtl. etwas doofe Frage, aber ich komme alleine gerade einfach nicht weiter : (
Und zwar habe ich Variablen aus einer Echtzeitmessung des Internetverhaltens. Sprich, wie lange/häufig war jemand auf der Website XY. Zur gleichen Website habe ich auch die Frequence der Besuche. Im Rohdatensatz sind die Variablen "Dauer des Besuchs" in Sekunden angegebenen und Besuchshäufigkeit in 1- bis x-mal.
Wenn ich die beiden Variablen "DAUER" und "FREQUENCE" miteinander korreliere, kommt ein recht hoher Korrelationskoeffizient raus, was auch zu erwarten ist.
Sobald ich jedoch die Variablen codiere, sinkt der Korrelationskoeffizient deutlich ab. Die Variablen Dauer brauche ich natürlich nicht in Sekunden, sondern ich möchte diese in "Unter 1/2 Stunde bis 1 Stunde", "1 Stunde bis unter 2 Stunden" etc. codieren und die Frequence in "1- bis 2-mal", "3- bis 4-mal", etc. Müsste die Korrelation nicht eigentlich gleich bleiben, denn ich mach ja eigentlich nichts anderes, als die Antworten zu Gruppen zusammenzufassen, deshalb darf sich doch im Ergebnis nichts ändern, oder?