Analisi della linea temporale


10

Sto conducendo ricerche sulla relazione tra l'ordine di nascita di una persona e il successivo rischio di obesità utilizzando i dati di diverse coorti di nascita di 1 anno (ad es. Http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2908417/ ).

Una sfida chiave è che l'ordine di nascita è collegato ad altre caratteristiche come l'età materna, il numero di fratelli più piccoli e / o anziani e la distanza di nascita, che possono anche influenzare il risultato attraverso meccanismi diversi. Inoltre, qualsiasi influenza di queste cose sul successivo rischio di obesità potrebbe essere modificata dalla composizione di genere dei fratelli, incluso il "bambino indice" (il partecipante alla coorte di nascita).

Per ogni bambino indice, si potrebbe tracciare una linea temporale che mostra tutte le nascite in famiglia, con l'età materna alla variabile temporale.

inserisci qui la descrizione dell'immagine

Sto cercando di identificare metodi per analizzare questo tipo di dati, in cui l'ordine, i tempi e la natura degli eventi potrebbero essere tutti importanti. Sto ponendo questa domanda qui a causa della diversità delle applicazioni con cui i membri lavorano - mi aspetto che qualcuno abbia alcuni suggerimenti immediati che mi impiegheranno molto più tempo per identificarmi da solo. Qualunque spinta nella giusta direzione (e) sarebbe molto apprezzata.

Domande correlate: come devo analizzare i dati sugli intervalli di nascita delle donne?


1
+1. La solita domanda: hai i dati per il BMI dei genitori?
Deer Hunter

Sì, ci sono alcuni dati antropometrici longitudinali per le madri dei bambini indice. Sfortunatamente non sui fratelli, precludendo qualsiasi analisi tra famiglia o inter vs.
DL Dahly,

Al momento non ci sono molti pensieri utili sulla questione della sequenza temporale. Potresti voler avere l'età materna al primo parto come un'altra variabile indipendente; Presumo che tu abbia già fatto analisi esplorative e visualizzazione ...
Deer Hunter

Chiaramente è importante tenere conto dell'età materna, motivo per cui le scadenze sopra indicate utilizzano l'età materna come variabile temporale. Immagino che ciò che spero di trovare sia un metodo alternativo che offre molto di più che gettare tutto in un modello lineare.
DL Dahly,

Non sono sicuro se questo sia importante, ma penso che il peso alla nascita o il peso alla nascita medio dei figli di una donna potrebbe essere una covariata interessante. Inoltre, puoi fornire ulteriori informazioni sui risultati? Hai misure ripetute?
ReliableResearch

Risposte:


2

Si potrebbe prendere in considerazione l'utilizzo di modelli multilivello (regressione mista) per stimare gli effetti tra e all'interno della famiglia. Una possibile strategia è quella di utilizzare un approccio gerarchico pianificato alla costruzione di modelli. Ad esempio, testare ogni potenziale predittore in un modello univariato. Se gli effetti tra famiglie rimuovono l'effetto dell'ordine di nascita, suggerirebbe fortemente che l'ordine di nascita non è importante, ma che lo sono altre influenze. Un esempio di citazione per questo per gli effetti dell'ordine di nascita sul QI:

Spero che questo sia utile.


+1 per una buona idea, mi sono imbattuto anche io, ma non ho dati sui risultati dei fratelli per questa particolare analisi.
DL Dahly,

0

Mi sto avvicinando a questo come una domanda statistica e non ho una conoscenza specifica delle questioni mediche.

Guardando l'articolo a cui ti riferisci, vedo che una coorte conteneva 970 individui. Se si dispone di dati su più coorti di circa tale dimensione, la dimensione complessiva del set di dati offre l'opportunità di selezionare sottoinsiemi ragionevolmente grandi in cui la sequenza temporale di ciascun individuo soddisfa condizioni specifiche. Ad esempio, un sottoinsieme potrebbe includere, per esempio, tutti i soggetti maschi con età materna di 25-29 anni. Una regressione, per un tale sottoinsieme, di una misura adeguata dell'obesità successiva contro l'ordine di nascita eliminerebbe qualsiasi possibile effetto sulla successiva obesità delle differenze di genere del bambino indice e in gran parte eliminerebbe qualsiasi possibile effetto dell'età materna.

Non è semplice estendere questo approccio al genere dei fratelli poiché se una condizione per un sottoinsieme fosse, diciamo, che il figlio indice abbia una sorella femmina più anziana, ciò implica che il figlio indice non è esso stesso un figlio maggiore, restringendo l'intervallo della variabile indipendente nella regressione. Tuttavia, un modo per aggirare questo potrebbe essere quello di definire le condizioni usando "eventuali". Ad esempio, un sottoinsieme potrebbe essere definito per includere tutti gli individui di sesso maschile con età compresa tra 25 e 29 anni e con eventuali fratelli maggiori, tutte femmine. Tale sottoinsieme includerebbe comunque individui con qualsiasi ordine di nascita.

Se un sottoinsieme fosse definito da un insieme di condizioni troppo complesso, il numero di individui in esso contenuti potrebbe essere così piccolo che le risultanti stime dei coefficienti sarebbero troppo imprecise per essere utili. Se questo approccio venisse adottato, sarebbe probabilmente necessario un compromesso decisionale, nel definire i sottoinsiemi, tra l'eliminazione del maggior numero possibile di effetti e l'inclusione di un numero sufficiente di individui per ottenere un risultato utile.


Grazie per la risposta Adam. In questo caso, tuttavia, non penso che stratificare il campione ti dirà qualcosa al di là di un modello regolato in modo simile. Potrebbe benissimo essere che un modello lineare adeguatamente specificato sia il modo migliore per farlo ... Speravo solo di vedere se gli statistici in altri campi hanno affrontato problemi simili in modi diversi.
DL Dahly

Concordo - se questo è ciò che stai dicendo - che il mio approccio equivale a una singola regressione sull'intero set di dati utilizzando numerose variabili indicatore. Prendendo ad esempio l'età materna, un potenziale problema con qualsiasi modello che la tratta come una variabile continua è che richiede un'ipotesi sulla forma funzionale (una relazione tra l'età materna e l'obesità successiva potrebbe essere curvilinea). Al contrario, un modello che utilizza un insieme di variabili indicatrici per fasce di età materna non ha bisogno di tale ipotesi e sotto questo aspetto è più generale.
Adam Bailey,

0

Suggerirei l'analisi dei dati funzionali, ma sospetto che potresti avere molte famiglie con troppi bambini per ottenere stime ragionevoli. Vai avanti e leggi anche se, poiché soddisfa le tue esigenze. Forse qualcuno lo ha già usato con dati simili.

Se non si desidera fare qualcosa di così enormemente non parametrico, è necessario utilizzare la propria esperienza clinica per ridurre la dimensionalità dei dati. Ad esempio, una variabile nel modello potrebbe essere il numero di bambini, un altro potrebbe essere il numero medio di anni tra i bambini e così via. Se c'è qualche effetto in queste variabili, può apparire anche se non hai specificato correttamente il modulo funzionale immediatamente. L'ulteriore costruzione di modelli basati sulla conoscenza può consentire di creare un modello altamente predittivo: assicurati di mantenere un set di validazione!


Uso la FDA e non sono sicuro di come si applichi. Potrei impostare l'asse x = 0 per ciascun figlio indice e avere altri fratelli tracciati a +/- tempo su quell'asse; e avere l'età materna come asse y; e quindi stimare un oggetto dati monotonico funzionale per ciascun figlio indice ... ma appena ho fatto questo ho perso tutte le informazioni sul numero effettivo di fratelli e su dove cadono lungo la linea (perché tutto è ora riassunto da la funzione). La FDA include una serie di modalità di analisi: avevi in ​​mente qualcosa di più specifico?
DL Dahly
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.