Hallo zusammen,
ich habe ein weiteres Problem in einem großen Datensatz (mehr als eine Millionen Fälle).
Ich denke, der Titel trifft das Problem nicht richtig, daher hier ausführlich:
Das Problem, welches ich gerne mit einer Syntax regeln würde, wäre dieses:
Ich möchte Variablen (gekauftes Produkt) aus einem Datensatz (nennen wir in Datensatz 1) in einen anderen (Datensatz 2) anhand einer Schlüsselvariable (ID taucht nur einmal in Datensatz 2 auf; taucht unbestimmt mehrfach in Datensatz 1 auf) hinzufügen. Das Besondere ist, das die Variable des gekauften Produktes als neue Variable im anderen Datensatz 2 aufgenommen werden soll. Bis hierhin ist es einfaches Hinzufügen von neuen Variablen.
ABER, da Personen immer mehr als ein Produkt kaufen und ich nicht möchte, dass das erste Produkt zweimal aufgenommen wird, sollte es möglich sein, dass in Datensatz 2 mehrere gekaufte Produkte (Datensatz 1) einer ID in Datensatz 2 zugeordnet werden soll. Dementsprechend sollten mehrere gekaufte Produkte aus Datensatz 1 der ID in Datensatz 2 zugeordnet und immer weitere Produktvariablen (die Anzahl der Produkte variiert und kann von 1 bis über 100 gehen) in Datensatz 2 (automatisch?!) hinzugefügt werden.
Ich möchte also alle gekauften Produkte einer ID aus Datensatz 1 (mehrere Fälle mit der gleichen ID) in mehreren Variablen einer ID in Datensatz 2 zugeordnet haben (ohne die Dopplung des ersten Produktes-hierzu können noch weitere Schlüsselvariablen genutzt werden).
Ich hoffe ich konnte es verständlich erklären?!
Mit freundlichen Grüßen
Tianchris