Attualmente sto lavorando con una vasta serie di dati sulle richieste di risarcimento che includono alcuni reclami di laboratorio e di farmacia. Le informazioni più coerenti nel set di dati, tuttavia, sono costituite da diagnosi (ICD-9CM) e codici di procedura (CPT, HCSPCS, ICD-9CM).
I miei obiettivi sono:
- Identificare le condizioni precursori più influenti (comorbidità) per una condizione medica come la malattia renale cronica;
- Identificare la probabilità (o probabilità) che un paziente sviluppi una condizione medica in base alle condizioni che ha avuto in passato;
- Fare lo stesso di 1 e 2, ma con procedure e / o diagnosi.
- Preferibilmente, i risultati sarebbero interpretabili da un medico
Ho esaminato cose come i documenti del Milestone del Premio sulla salute del patrimonio e ho imparato molto da loro, ma sono focalizzati sulla previsione dei ricoveri.
Quindi, ecco le mie domande: quali metodi pensi che funzionino bene per problemi come questo? E quali risorse sarebbero più utili per conoscere le applicazioni e i metodi di scienza dei dati relativi all'assistenza sanitaria e alla medicina clinica?
EDIT # 2 per aggiungere una tabella di testo in chiaro:
CKD è la condizione target, "malattia renale cronica", ".ogni" indica che hanno acquisito quella condizione in qualsiasi momento, ".isbefore.ckd" significa che avevano quella condizione prima della loro prima diagnosi di CKD. Le altre abbreviazioni corrispondono ad altre condizioni identificate dai raggruppamenti di codici ICD-9CM. Questo raggruppamento si verifica in SQL durante il processo di importazione. Ogni variabile, ad eccezione di patient_age, è binaria.