Hallo zusammen,
ich habe eine Datei (siehe Screenshot) in der grundlegende Nutzerdaten gespeichert sind: User ID, Geschlecht und dann eine unbestimmte Anzahl an Internetadressen. Ich möchte nun herausfinden:
- Welche Internetadressen am meisten aufgerufen werden (allgemein)
- Welche Internetadressen am meisten von welchen Geschlechtern aufgerufen werden
- Falls dies irgendwie möglich ist, Muster erkennen, z.B. gibt es abfolgen von webseiten die von Nutzern besonder häufig genutzt werden, also sowas wie ein Weg durch die Webseiten Hierarchie.
Ich habe schon versucht das aus Spass mal zu "Clustern" aber da ist das Problem, dass das mit Text nicht geht. Ich müsste also wohl eine Umkodierung vornehmen und für jeden Link dann eine numerische ID haben?
Momentan versuche ich gerade SPSS zu lernen was sich allerdings als etwas schwierig herausstellt, besonders wenn man keine tiefen Taschen hat für Training.
Vielleicht kann ja einer der Profis hier helfen?
Vielen Dank im Voraus,
DM