Potenza in proteomica?


9

Le sovvenzioni spesso richiedono un'analisi di potenza per supportare la dimensione del campione proposta. In proteomica (e nella maggior parte dei casi -omici), ci sono da 100 a 1000 di caratteristiche / variabili misurate su 10 di campioni (forse 100, ma improbabile). Inoltre, è noto che alcune di queste unità di misura (ad es. Conteggi spettrali di proteine) non sono normalmente distribuite e quindi utilizzeremo test non parametrici per l'analisi. Ho visto la potenza di una dimensione del campione determinata assumendo una singola misurazione e assumendo un test t, ma non penso che sia completamente corretto. Un altro problema con i conteggi spettrali in particolare è che ognuna delle 100 caratteristiche è su scale molto diverse con errori molto diversi (valori più grandi hanno meno errori). [Questo problema è ben descritto nel modello di modifica del limite di piegatura, Mutch et al., 2002 ]

Quale sarebbe il modo appropriato per determinare la potenza di una dimensione del campione proposta dati alcuni presupposti di FDR e un cambiamento di piega accettabile? Utilizzando lo strumento qui sono stato in grado di determinare dato quanto segue:

  • 300 geni
  • 3 falsi positivi
  • 1.4 differenze di piega
  • 0,8 potenza desiderata
  • 0.7 stdev

richiede una dimensione del campione per gruppo di 49.

Questo è stato utile dal momento che sto proponendo un design 50v50, so che il cambio di 1,4 volte è abbastanza accettato, l'1% di FDR va bene e probabilmente misurerò 300 proteine ​​in questo esperimento. Questo problema di calcolo della potenza o della dimensione del campione continuerà a verificarsi, quindi sarebbe bello avere un approccio referenziato in atto.

EDIT: ho letto dove un collega ha proposto di modellare i conteggi spettrali da distribuzioni binominali negative usando la funzione di verosimiglianza seguita da un test di Wald. Fondamentalmente utilizza i dati prelim per ottenere stime di varianza delle proteine ​​e quindi calcolare le variazioni di piega rilevabili tra i gruppi per ciascun quantile. C'è anche un input FDR (alfa). Pertanto, con una potenza> 80% e impostando le dimensioni del campione, possono determinare cambiamenti di piega rilevabili con una varianza minima del 25%, una varianza più piccola del 50% e una varianza massima del 25%. Il problema è che non so come abbiano fatto. Non sono sicuro se la condivisione di questo approccio aiuterà chiunque abbia una possibile risposta.


Alcune altre risorse che ho trovato su questo argomento: Levin 2011 Dicker et al., 2010
Ben

1
Quel calcolatore MD Anderson mi sembra eccessivamente ottimista. Quanti confronti vengono effettuati? (Sono troppo arrugginito sui microarrays: 300 geni in un design 50v50 significano che fai quanti confronti ??) Quando imposti il ​​calcolatore FDR su 3 falsi positivi, stai dicendo che stai impostando un errore falso positivo in modo che solo 3 sono previsti falsi positivi sotto il valore null? È troppo severo per più di 60 confronti.
AdamO

1
Posso mostrarti come si farebbe in R, ma ho solo bisogno di un po 'di conoscenza della biologia.
AdamO

Risposte:


1

In applicazioni (in particolare applicazioni etiche, in cui devi fare uno studio di potenza), mi piace usare questo riferimento [Wang e Chen 2004], perché spiega bene il concetto alla base di un calcolo di potenza per dati ad alta produttività (qualunque siano i dati effettivamente) .

In sostanza, oltre ai soliti parametri (α, β, N, dimensione dell'effetto) si usano due parametri aggiuntivi, λ e η. Quest'ultimo, η, è il numero presunto di geni realmente alterati e λ è la frazione dei geni veramente alterati che si desidera poter rilevare. È abbastanza semplice estendere qualsiasi calcolo di potenza noto a dati ad alta velocità usando questo approccio.

Wang, Sue-Jane e James J. Chen. "Dimensione del campione per identificare geni espressi in modo differenziato negli esperimenti di microarray." Journal of Computational Biology 11.4 (2004): 714-726.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.