Sono preoccupato per il problema che vorrei avviare il bootstrap del valore p per una stima di da dati moltiplicati (MI), ma che non mi è chiaro come combinare i valori p tra i set MI.
Per i set di dati MI, l'approccio standard per arrivare alla varianza totale delle stime utilizza le regole di Rubin. Vedere qui per una revisione del pooling di set di dati MI. La radice quadrata della varianza totale funge da stima dell'errore standard di . Tuttavia, per alcuni stimatori la varianza totale non ha forma chiusa nota o la distribuzione campionaria non è normale. La statistica potrebbe quindi non essere distribuita in t, neppure asintoticamente.θ / s e ( θ )
Pertanto, nel caso dei dati completo, un'opzione alternativa è quella di avviare la statistica per trovare varianza, un valore p e un intervallo di confidenza, anche se la distribuzione di campionamento non è normale e la sua forma chiusa sconosciuta. Nel caso MI ci sono quindi due opzioni:
- Pool la varianza avviata nei set di dati MI
- Unisci il valore p o i limiti di confidenza tra i set di dati MI
La prima opzione avrebbe quindi usato nuovamente le regole di Rubin. Tuttavia, ritengo che ciò sia problematico, se ha una distribuzione di campionamento non normale. In questa situazione (o più in generale, in tutte le situazioni) è possibile utilizzare direttamente il valore p di bootstrap. Tuttavia, nel caso dell'MI, ciò porterebbe a più valori di p o intervalli di confidenza, che devono essere raggruppati in set di dati MI.
Quindi la mia domanda è: come devo mettere in comune più valori p (o intervalli di confidenza) avviati tra i set di dati imputati in modo multiplo?
Gradirei qualsiasi suggerimento su come procedere, grazie.