- tab2.pdf
- Tab 2
- (27.21 KiB) 153-mal heruntergeladen
- tab1.pdf
- Tab 1
- (26.38 KiB) 156-mal heruntergeladen
Liebe Forenmitglieder. Da ich weder auf Youtube noch in einem der Foren eine Lösung gefunden habe, bitte ich euch um Hilfe bei einem großen Datensatz. Ich habe das Problem im folgenden komprimiert und umbenannt:
Die Situation ist, dass innerhalb einer einzigen Variable die Oberkategorie (Motorreparatur) und Unterkategorie (Spezifizierung der Reparatur) durcheinander gelistet sind. Nicht immer wenn die Art der Reparatur spezifiziert wurde, ist auch die Oberkategorie (Motorreparatur) genannt. Und umgekehrt. Ich habe das Problem in Tab. 1 in den Spalten ID, Leistung, Leistung Numerisch illustriert.
Das Ziel ist, die Anzahl der Motorreparaturen zu ermitteln und die Anzahl und Art der Spezifikationen sowie
der nicht spezifizierten Reparaturen. Dabei ist jede Spezifizierung gleichbedeutend damit, dass
1 Motorreparatur stattfand.
Die Lösung in meinem illustrierendem Beispiel wäre: Insgesamt 4 Motorreparaturen, dabei 3 x Zylinderkopf, 1 x Kolben und 1 x nicht weiter spezifiziert.
Die Frage ist, wie ich dahin komme:
1. Die Anzahl unterscheidlicher IDs entspricht der Anzahl aller Motorreparaturen (die Liste ist so sortiert, dass keine "Reifenwechsel" mehr vorkommen)
2. Häufigkeiten der Spezifikationen (Zylinderkopf etc.) sind auch keine Problem (via Frequencies)
3. Problem ist nun, die Anzahl der Motorreparaturen ohne weitere Spezifikation zu ermitteln. Meine Vorstellung ist, eine neue Variable (varnew) zu erzeugen, die eine "101" vergibt, wenn in der var "Leistung numerisch" eine "1" vergeben ist AND es keinen weiteren Fall dazu gibt (d.h. ID ist nur einmal genannt).Das habe ich in Tab 2 illustriert.
Hat jemand die Zeit und Expertise mir zu helfen, diese Umkodierung vorzunehmen?
Vielen Dank für eure Unterstützung!