Störvariableneinschluss

Pearson, Spearman und co., Korrelationsanalysen aller Art mit SPSS.

Störvariableneinschluss

Beitragvon Milchmann » Fr 22. Dez 2023, 14:25

Hallo,

im Rahmen einer Analyse von verschiedenen Biomarkern bei einer Muskelerkrankung stehe ich vor folgender Frage:
Alter, Geschlecht, BMI und Krankheitsverlauf sind für einige dieser Biomarker der Literatur zufolge anerkannte Störvariablen. Für andere dieser Biomarker liegen hierzu nur wenig bis gar keine valide Daten vor.

In Teil 1 möchte ich gerne den Zusammenhang der Biomarker mit den motorischen Funktionen der Patienten berechnen.
Hier würde ich auf jeweilige partielle Korrelationen mit Berücksichtigung der Störvariablen zurückgreifen.

Teil 2 konzentriert sich auf die Unterschiede der jeweiligen Biomarkerkonzentrationen zwischen drei Untergruppen der Erkrankung. Dabei würde ich eine ANCOVA unter Einbeziehung der Störvariablen als Kovariaten rechnen.

Meine Frage ist nun, wie ich hinsichtlich des Einschlusses der Störvariablen am besten vorgehen sollte:
Die eine Option wäre, zunächst bivariate Korrelationen (Biomarker und o.g. Störvariablen) zu rechnen und dann nur diese als Confounder in das Modell einzuschließen, die tatsächlich einen signifikanten Effekt statistisch in meiner Kohorte zeigen.
Die andere wäre, auf empirischer Basis von Literaturangaben alle 4 systematisch bei allen Biomarkern als Störvariablen mit einzubeziehen - ungeachtet der Tatsache, dass einige davon in den vorherigen Korrelationen gar keinen sign. Zusammenhang mit den Biomarkern zeigen.

Was würdet ihr hier vorschlagen?
Ich möchte es natürlich möglichst systematisch einheitlich halten und zugleich Overfitting vermeiden. Auch sollte die Entscheidung der jeweiligen Option inhaltlich plausibel und nachvollziehbar sein.

Vielen Dank im Voraus und fröhliche Weihnachten,
M
Milchmann
 
Beiträge: 16
Registriert: Di 21. Jan 2020, 21:44
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Störvariableneinschluss

Beitragvon ponderstibbons » Fr 22. Dez 2023, 15:50

Alter, Geschlecht, BMI und Krankheitsverlauf sind für einige dieser Biomarker der Literatur zufolge anerkannte Störvariablen.

Was ist damit präzise gemeint?
Die eine Option wäre, zunächst bivariate Korrelationen (Biomarker und o.g. Störvariablen) zu rechnen und dann nur diese als Confounder in das Modell einzuschließen, die tatsächlich einen signifikanten Effekt statistisch in meiner Kohorte zeigen.

Sowas mache man auf gar keinen Fall. Führt zu overfitting. Davon ab ist "statistische Signfikanz"
letztlich doch bloß eine Frage ausreichender Stichprobengröße. Wenn man fachlich genügend Grund
zu der Annahme hat, dass diese Variablen eine Scheinkorrelation hervorrufen könnten (ist das mit
"Störvariable" gemeint?) dann nimmt man sie ins Modell und lässt es damit gut sein.


Mit freundlichen Grüßen

PonderStibbons
ponderstibbons
 
Beiträge: 2523
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 2
Danke bekommen: 257 mal in 256 Posts

Re: Störvariableneinschluss

Beitragvon strukturmarionette » Fr 22. Dez 2023, 16:02

Hi,

- AV (konkret)?
- N?
- Zustandekommen von N? (auch n1? n2? n3)
- Wie wurden alle Messwerte jeweils erhoben?
- Hypothesen?

Gruß
S.
strukturmarionette
 
Beiträge: 2504
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 7
Danke bekommen: 122 mal in 122 Posts


Zurück zu Korrelationen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 4 Gäste

cron