Hallo liebes Forum,
ich hoffe, mir kann jemand weiterhelfen.
Situation:
Für über 10000 Patienten (jeder Patient ist ein Fall = eine Zeile!) sollen die Kombinationen der eingenommenen Medikamente ermittelt werden.
Dabei sieht die Datenstruktur wie folgt beispielhaft aus:
Patient-Nr. Medikament1 Medikament2 Medikament 3 Medikament4
1 Aspirin Diclofenac Paracetamol
2 Ibuprofen Paracetamol
3 Paracetamol Aspirin Diclofenac
4 Diclofenac
5 Paracetamol Ibuprofen
Augenscheinlich kann man erkennen, dass hier für Patient Nr. 1 und 3 die gleiche Kombination vorliegt. In welcher Variablen die Medikamente (Reihenfolge) stehen ist dabei unwichtig.
Weiterhin liegt für Patient Nr. 2 und 5 auch die gleiche Kombination vor.
Bei wenigen Fällen kann man das Problem der Kombinationsfindung und damit der Häufigkeit an Aufgetretenen Kombinationen manuell lösen. Aber nicht bei vielen (sehr vielen) Fällen.
Am Ende soll eine Tabelle erstellt werden, anhand derer man die Häufigkeit der Medikamenten-Kombinationen ablesen kann.
Wer kann mir helfen?
Alex