Esiste un ramo di statistiche che si occupa di dati per i quali non sono noti valori esatti , ma per ogni individuo conosciamo un limite massimo o minimo al valore ?
Sospetto che il mio problema derivi in gran parte dal fatto che sto lottando per articolarlo in termini statistici, ma spero che un esempio possa aiutare a chiarire:
Supponiamo che ci siano due popolazioni collegate e tali che, ad un certo punto, i membri di A possano "passare" in B , ma non è possibile il contrario. I tempi della transizione sono variabili, ma non casuali. Ad esempio, A potrebbe essere "individui senza prole" e B "individui con almeno una prole". Sono interessato all'età in cui si verifica questa progressione, ma ho solo dati trasversali. Per ogni individuo, posso scoprire se appartengono ad A o B . Conosco anche l'età di questi individui. Per ogni individuo nella popolazione AB A B A B A B A, So che l'età alla transizione sarà maggiore della loro età attuale. Allo stesso modo, per i membri di , so che l'età alla transizione era MENO DELLA loro età attuale. Ma non conosco i valori esatti.
Supponiamo che io abbia qualche altro fattore che voglio confrontare con l'età della transizione. Ad esempio, voglio sapere se la sottospecie di un individuo o le dimensioni del corpo influenzano l'età della prima prole. Ho sicuramente alcune informazioni utili che dovrebbero informare quelle domande: in media, degli individui in , gli individui più anziani avranno una transizione successiva. Ma l'informazione è imperfetta , in particolare per le persone più giovani. E viceversa per la popolazione .
Esistono metodi consolidati per gestire questo tipo di dati ? Non ho necessariamente bisogno di un metodo completo su come eseguire tale analisi, solo alcuni termini di ricerca o risorse utili per iniziare nel posto giusto!
Avvertenze: sto assumendo la semplificazione del presupposto che la transizione da a è istantanea. Sono anche pronto ad assumere che la maggior parte degli individui ad un certo punto passerà a , supponendo che vivano abbastanza a lungo. E mi rendo conto che i dati longitutinali sarebbero molto utili, ma presumo che non siano disponibili in questo caso.B B
Mi scuso se questo è un duplicato, come ho detto, parte del mio problema è che non so cosa dovrei cercare. Per lo stesso motivo, aggiungi altri tag se appropriato.
Set di dati campione: Ssp indica una delle due sottospecie, o . La prole indica che non vi è prole ( ) o almeno una prole ( )Y A B
age ssp offsp
21 Y A
20 Y B
26 X B
33 X B
33 X A
24 X B
34 Y B
22 Y B
10 Y B
20 Y A
44 X B
18 Y A
11 Y B
27 X A
31 X B
14 Y B
41 X B
15 Y A
33 X B
24 X B
11 Y A
28 X A
22 X B
16 Y A
16 Y B
24 Y B
20 Y B
18 X B
21 Y B
16 Y B
24 Y A
39 X B
13 Y A
10 Y B
18 Y A
16 Y A
21 X A
26 X B
11 Y A
40 X B
8 Y A
41 X B
29 X B
53 X B
34 X B
34 X B
15 Y A
40 X B
30 X A
40 X B
Modifica: set di dati di esempio modificato in quanto non molto rappresentativo