Liebe SPSS-Forums-Mitglieder*innen,
ich bin neu hier, hole mir aber immer mal wieder Tipps und Hilfe durch bestehende Forenbeiträge. Deshalb an dieser Stelle schon mal Danke an alle "Problemlöser"!
Mein Problem habe ich noch in keinem Forum gefunden, daher melde ich mich. Ggf. wird es durch die Überschrift auch nicht 100% getroffen. Hier meine Problemstellung, das ich gerne mit einem/mehrerer Syntaxbefehlte lösen würde (deshlab mein Eintrag in dieses Forum, ggf. kann ich hier aber auch falsch sein):
Ich möchte gerne aus einem großen Datensatz doppelte Fälle innerhalb einer Gruppe durch ein Zufallsprinzip löschen. Anders ausgedrückt, in meinem großen Datensatz gibt es eine Variable, in der viele unterschiedliche kleine Gruppen - vielleicht auch Cluster, bin mir bei dem Begriff nicht 100% sicher- sind. Aus diesen Gruppen möchte ich gerne zufällig einen Fall behalten bzw. alle Fälle, bis auf den einen zufällig ausgesuchten, löschen. Der Fokus liegt darauf, dass dieser Fall zufällig von SPSS bestimmt wird.
Die Datenstruktur sieht so aus, dass innerhalb dieser Variable ein Wert einmal bis elfmal oder noch häufiger auftauchen kann.
Falls meine Herangehensweise falsch ist, hier der Kontext der Problemstellung:
Ich arbeite zur Zeit an einem großen Datensatz mit über einer 1.000.000.000 Fälle. In diesem Datensatz kann jeder Fall einer bestimmten Person zugeordnet werden (sagen wir durch Variable Identität). Einige der Personen tauchen häufiger im Datensatz auf, einige nur einmal. Ich möchte nun, dass jede Person nur einmal auftaucht, ABER das diese eine Person zufällig durch SPSS bestimmt wurde.
Ich hoffe konnte mein Problem ausreichend verständlich beschreiben, ich bin sehr dankbar für Hilfestellungen, noch lieber in Syntaxform!
Viele Grüße
Tianchris