Dimensione del campione per proporzioni in misure ripetute


9

Sto cercando di aiutare uno scienziato a progettare uno studio per la presenza di microbi di salmonella. Vorrebbe confrontare una formulazione antimicrobica sperimentale con un cloro (candeggina) negli allevamenti di pollame. Poiché i tassi di background della salmonella differiscono nel tempo, ha in programma di misurare la percentuale di pollame con la salmonella prima del trattamento e dopo il trattamento. Quindi la misurazione sarà la differenza di prima / dopo% salmonella per le formule sperimentali rispetto al cloro.

Qualcuno può consigliare su come stimare le dimensioni del campione necessarie? Supponiamo che il tasso di background sia del 50%; dopo candeggina è del 20%; e vogliamo rilevare se la formulazione sperimentale modifica il tasso di +/- 10%. grazie

EDIT: quello con cui sto lottando è come incorporare i tassi di background. Chiamiamoli p3 e p4, i tassi "prima" di salmonella per i campioni di candeggina e sperimentali, rispettivamente. Quindi la statistica da stimare è la differenza di differenze: Sperimentale (After-Before) - Bleach (After-Before) = (p0-p2) - (p3-p1). Per tenere pienamente conto della variazione campionaria delle percentuali "prima" di p2 e p3 nel calcolo della dimensione del campione --- è semplice come usare p0 (1-p0) + p1 (1-p1) + p2 (1-p2) + p3 (1-p3) ovunque ci sia un termine di variazione nell'equazione della dimensione del campione? Lascia che tutte le dimensioni dei campioni siano uguali, n1 = n2 = n.


2
È un'ottima domanda La soluzione ottimale dipenderà da alcune cose aggiuntive, tra cui (a) i principali elementi del costo, incluso il costo dell'inclusione di un'azienda agricola e il costo della misurazione di una materia; e (b) il disegno sperimentale. Ad esempio, entrambe le soluzioni di trattamento e controllo saranno applicate in ogni azienda (una buona scelta, ma non senza i suoi potenziali problemi) o sarai in grado di applicare solo una soluzione in ogni azienda? I soggetti saranno raggruppati (fisicamente) all'interno delle aziende agricole o trattati e campionati veramente a caso?
whuber

Ho integrato la risposta della tua estensione alla domanda.

Risposte:


2

Diamo un'occhiata all'approssimazione del primo ordine ipotizzando un semplice campionamento casuale e una proporzione costante di infezione per qualsiasi trattamento. Supponiamo che la dimensione del campione sia abbastanza grande da poter utilizzare un'approssimazione normale in un test di ipotesi sulle proporzioni in modo da poter calcolare la statistica az in questo modo

z=pt-p0p0(1-p0)(1n1+1n2)

Questa è la statistica campione per un test a due campioni, nuova formula contro candeggina, poiché prevediamo che l'effetto della candeggina sia casuale e l'effetto della nuova formula.

n=n1=n2|pt-p0|0.1p0=0.2|z|2n128

Consiglierei di fare un calcolo simile basato sulla potenza desiderata per il test per controllare l'errore di tipo II, poiché un design sottodimensionato ha un'alta probabilità di perdere un effetto reale.

Una volta che hai fatto tutto questo spadework di base, inizia a guardare gli indirizzi whuber roba . In particolare, non è chiaro dall'affermazione del problema se i campioni di pollame misurati sono diversi gruppi di soggetti o gli stessi gruppi di soggetti. Se sono uguali, ti piacciono i test t accoppiati o il territorio di misure ripetute e hai bisogno di qualcuno più intelligente di me per dare una mano!


Buon inizio (+1). La formula necessita di alcuni aggiustamenti. La varianza della differenza delle proporzioni è uguale a p0 (1-p0) / n0 + p1 (1-p1) / n1. Con n0 = n1 = n e p0 = .5, p1 = .2, che equivale a 0,41 / n, implicando n = 41 z ^ 2. Nota anche che questo è un test unilaterale, quindi z = 1.65 funziona bene. (È necessaria una certa precisione perché il risultato è sensibile alla quadratura di z.) Indipendentemente da ciò, questi calcoli stabiliscono che circa 10 ^ 2 soggetti indipendenti dovranno essere testati se questo modello è corretto. (Io non aspettatevi la candeggina o la nuova formula di avere effetti "casuali".)
whuber

Mike Anderson e Whuber, grazie per i tuoi suggerimenti. Hai fatto buone domande, a cui proverò a rispondere. Le unità sperimentali di pollame saranno casuali, non da gruppi. A partire da ora, il costo non è una considerazione.
Paul,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.