Le sovvenzioni spesso richiedono un'analisi di potenza per supportare la dimensione del campione proposta. In proteomica (e nella maggior parte dei casi -omici), ci sono da 100 a 1000 di caratteristiche / variabili misurate su 10 di campioni (forse 100, ma improbabile). Inoltre, è noto che alcune di queste unità di misura (ad es. Conteggi spettrali di proteine) non sono normalmente distribuite e quindi utilizzeremo test non parametrici per l'analisi. Ho visto la potenza di una dimensione del campione determinata assumendo una singola misurazione e assumendo un test t, ma non penso che sia completamente corretto. Un altro problema con i conteggi spettrali in particolare è che ognuna delle 100 caratteristiche è su scale molto diverse con errori molto diversi (valori più grandi hanno meno errori). [Questo problema è ben descritto nel modello di modifica del limite di piegatura, Mutch et al., 2002 ]
Quale sarebbe il modo appropriato per determinare la potenza di una dimensione del campione proposta dati alcuni presupposti di FDR e un cambiamento di piega accettabile? Utilizzando lo strumento qui sono stato in grado di determinare dato quanto segue:
- 300 geni
- 3 falsi positivi
- 1.4 differenze di piega
- 0,8 potenza desiderata
- 0.7 stdev
richiede una dimensione del campione per gruppo di 49.
Questo è stato utile dal momento che sto proponendo un design 50v50, so che il cambio di 1,4 volte è abbastanza accettato, l'1% di FDR va bene e probabilmente misurerò 300 proteine in questo esperimento. Questo problema di calcolo della potenza o della dimensione del campione continuerà a verificarsi, quindi sarebbe bello avere un approccio referenziato in atto.
EDIT: ho letto dove un collega ha proposto di modellare i conteggi spettrali da distribuzioni binominali negative usando la funzione di verosimiglianza seguita da un test di Wald. Fondamentalmente utilizza i dati prelim per ottenere stime di varianza delle proteine e quindi calcolare le variazioni di piega rilevabili tra i gruppi per ciascun quantile. C'è anche un input FDR (alfa). Pertanto, con una potenza> 80% e impostando le dimensioni del campione, possono determinare cambiamenti di piega rilevabili con una varianza minima del 25%, una varianza più piccola del 50% e una varianza massima del 25%. Il problema è che non so come abbiano fatto. Non sono sicuro se la condivisione di questo approccio aiuterà chiunque abbia una possibile risposta.