Cos'è un blocco nel design sperimentale?


20

Ho due domande sulla nozione di blocco nella progettazione sperimentale: (1) Qual è la differenza tra un blocco e un fattore? (2) Ho provato a leggere alcuni libri ma qualcosa non è chiaro: sembra che gli autori presumano sempre che non vi sia interazione tra il "fattore di blocco" e altri fattori: è giusto, e se lo è, perché?

Risposte:


13
  1. Il blocco è un fattore. Lo scopo principale del blocco è ridurre la variazione inspiegabile di un disegno rispetto al disegno non bloccato. Non siamo interessati all'effetto blocco di per sé , piuttosto ci blocchiamo quando sospettiamo che il "rumore" di fondo rompa l'effetto del fattore reale.(SSReSioduun'l)
    Raggruppiamo unità sperimentali in blocchi "omogenei" in cui tutti i livelli del fattore principale sono equamente rappresentati. L'analisi della varianza di un disegno di blocco di controllo randomizzato divide il termine residuo di un disegno randomizzato completo a singolo fattore equivalente in blocchi e componenti residui. Dobbiamo notare, tuttavia, che quest'ultimo componente ha meno gradi di libertà rispetto ai progetti CR a fattore singolo, portando a stime più elevate per .MSReSioduun'l=SSReSioduun'l/d.f.
    La decisione di bloccare o non bloccare dovrebbe essere presa quando calcoliamo che la diminuzione dei residui compenserà più che la diminuzione di df

  2. Di solito un modello additivo è adattato ai dati di progettazione RCB, in cui la variabile di risposta è una combinazione additiva del fattore e degli effetti di blocco e si presume che non esista alcuna interazione tra i due. Penso che ciò sia giustificato dal fatto che RCB non ci consente di distinguere l'interazione BxF dalla variabilità all'interno del Blocco e la variabilità all'interno delle unità sperimentali. La linea di fondo è che non dobbiamo assumere alcuna interazione poiché non possiamo misurarla. Tuttavia, possiamo verificare se è presente visivamente o con il test di Tukey.

Una buona risorsa sul design sperimentale è questa .


(+1) Un'altra buona lettura è la progettazione e l'analisi degli esperimenti di Montgomery .
chl

Grazie @chl. Montgomery era sulla mia lista della spesa ma ho deciso di non acquistarlo poiché era più orientato all'ingegneria che all'ecologia. Ho notato che una nuova edizione dovrebbe essere pubblicata ad aprile 2012, aggiornerai il tuo compagno R?
Charlie

1
Grazie a tutti. Preferisco avere una mente matematica, quindi ho difficoltà a leggere libri come quello di Montgomery in cui c'è troppo testo e non abbastanza matematica
Stéphane Laurent

@Charlie Yup, questo è un progetto che risale al 2006 quando la view Task Doe CRAN non esisteva affatto. Continuerò a lavorare sulla sesta versione con la speranza di finirla quest'anno (ma lo dico ogni anno nuovo, quindi ...). Oltre al campo di applicazione "parziale", penso ancora che il testo rimanga eccellente per psicologi e biologi.
chl

1
@ Stéphane Posso suggerire di dare un'occhiata a Risposte piane a domande complesse , di Christensen: meno DOE, più matematica e una bella introduzione ai modelli lineari.
chl

8

Ecco una risposta concisa. Molti dettagli ed esempi potrebbero essere trovati nella maggior parte dei documenti che trattano la progettazione di esperimenti; soprattutto in agronomia.

Spesso, il ricercatore non è interessato all'effetto blocco di per sé, ma vuole solo spiegare la variabilità nella risposta tra i blocchi. Quindi, uso per visualizzare il blocco come un fattore con un ruolo particolare. Da notare, l'effetto blocco è generalmente considerato come un effetto casuale. Infine, se si prevede che l'effetto del trattamento differisca da blocco a blocco, è necessario prendere in considerazione le interazioni.


7

Ecco una parafrasi della mia spiegazione preferita, dal mio ex insegnante Freedom King.

Stai studiando come l'impasto del pane e la temperatura di cottura influenzano la bontà del pane. Hai una scala di valutazione per la bontà. E supponiamo che tu stia acquistando un impasto di pane confezionato da qualche azienda alimentare piuttosto che mescolarlo da solo. Ogni pagnotta di pane al forno è un'unità sperimentale.

n=160

2×2

In alternativa, è possibile considerare il funzionamento del forno come un fattore di blocco . In questo caso, faresti funzionare il forno 40 volte, il che potrebbe rendere più veloce la raccolta dei dati. Ogni ciclo di cottura avrebbe quattro pagnotte, ma non necessariamente due per ogni tipo di impasto. (La proporzione esatta verrebbe scelta casualmente.) Avresti 5 cicli di cottura per ogni temperatura; questo potrebbe aiutarvi a tenere conto della variabilità tra le corse del forno a temperatura uguale.

Ancora più elaborato, potresti bloccare con l'impasto e con il forno. In questo progetto, avresti esattamente due di ogni tipo di impasto in ciascuna delle corse del forno.

Quando avrò tempo di pensarci su, lo aggiornerò ulteriormente con i nomi fantasiosi appropriati per quei progetti di esperimenti.


2×82×2

È un esempio di blocco incompleto?
SmallChess,

6

I disegni sperimentali sono una combinazione di tre strutture:

  1. La struttura del trattamento: come si formano i trattamenti da fattori di interesse?
  2. La struttura del progetto: in che modo le unità sperimentali sono raggruppate e assegnate ai trattamenti?
  3. La struttura di risposta: come vengono prese le osservazioni?

I blocchi sono "fattori" che appartengono alla struttura del progetto (per distinguere, non è una cattiva idea chiamarli "fattori di blocco" vs "fattori di trattamento"). Sono buoni esempi di parametri fastidiosi : parametri del modello che devi avere e di cui devi tenere conto, ma i cui valori non sono particolarmente interessanti. Si noti che ciò non ha nulla a che fare con la natura di un fattore: i fattori di blocco possono essere fissi o casuali, così come i fattori di trattamento possono essere fissi o casuali.

La mia regola empirica personale per quanto riguarda la posizione di un fattore in un progetto sperimentale è questa: se voglio stimare i parametri associati al fattore e confrontarli all'interno del parametro del fattore o di altri, allora appartiene alla struttura del trattamento. Se non mi interessano i valori dei parametri associati e non mi interessa confrontarli, il fattore appartiene alla struttura del progetto.

Quindi, nell'esempio del pane altrove in questo thread, devo preoccuparmi delle differenze run-to-run. Ma non mi interessa confrontare la corsa 1 con la corsa 24. La corsa del forno appartiene alla struttura del design . Ho fare mettere a confronto le due ricette di pasta: ricetta appartiene alla struttura di trattamento. Mi preoccupo della temperatura del forno: appartiene anche alla struttura del trattamento. Costruiamo un disegno sperimentale.

La struttura del design ha un fattore (funzionamento del forno, funzionamento) e la struttura del trattamento due fattori (ricetta e temperatura). Poiché ogni corsa deve essere una singola temperatura (nominale), la temperatura e la corsa devono avvenire allo stesso livello del progetto sperimentale. Tuttavia, c'è spazio per 4 pagnotte in ogni corsa. Ovviamente, possiamo scegliere di cuocere 1, 2, 3 o 4 pagnotte per corsa.

Se creiamo una pagnotta per corsa e randomizziamo l'ordine della presentazione della ricetta, otteniamo una struttura di design completamente randomizzato (CRD). Se cuociamo due pagnotte, una per ogni ricetta per corsa, abbiamo una struttura randomizzata a blocchi completi (RCB). Si noti che è importante che ogni Ricetta si verifichi all'interno di ciascuna Esecuzione. Senza tale equilibrio, i confronti delle ricette saranno contaminati dalle differenze di esecuzione. Ricorda: l'obiettivo del blocco è eliminare le differenze di corsa. Se cuociamo tre pani per Run, probabilmente saremmo pazzi: 3 non è un fattore di 160, quindi avremo uno o due blocchi di dimensioni diverse. L'altra ragionevole possibilità è di quattro pagnotte per Run. In questo caso, cuoceremmo due pagnotte di ogni ricetta in ogni corsa. Ancora una volta, questa è una struttura RCB. È possibile stimare la variabilità all'interno della corsa utilizzando le differenze tra i due pani di ciascuna ricetta in ciascuna corsa.

Se scegliamo una delle strutture di progettazione RCB, gli effetti della temperatura sono completamente randomizzati a livello di Run. La ricetta è nidificata all'interno della temperatura e presenta una struttura di errore diversa rispetto alla temperatura, poiché ogni impasto appare all'interno di ogni ciclo. I contrasti che osservano la ricetta e la ricetta per non additività (interazione) dell'impasto non presentano una variabilità da corsa a corsa. Tecnicamente, questo viene chiamato variamente una struttura di progettazione a trama divisa o una struttura di progettazione a misure ripetute .

Quale utilizzerebbe l'investigatore? Probabilmente l'RCB con quattro pagnotte: 40 corse contro 80 contro 160 porta molto peso. Tuttavia, questo può essere modificato: se la preoccupazione riguarda i forni domestici anziché la produzione industriale, potrebbe esserci motivo di utilizzare il CRD se si ritiene che i fornai domestici raramente cuocano più pagnotte.


2
Non seguo la tua analisi dell'esperimento sul pane, forse perché sono stati menzionati diversi progetti di quell'esperimento e non specifichi a quale / i si riferisca. Ciò rende la maggior parte dei tuoi commenti confusi piuttosto che illuminanti. Se potessi chiarire questo, credo che la tua risposta risalterebbe.
whuber

1
L'importanza del n. 2 merita di essere messa in luce. L'analisi può essere effettuata sulla base dell'assegnazione casuale di trattamenti sperimentali: i blocchi rappresentano restrizioni su tale assegnazione casuale.
Scortchi - Ripristina Monica

1
@whuber Questo perché non lo stavo analizzando, stavo progettando un esperimento da quei parametri de novo . Chiarito nella modifica.
Dennis,

3

Penso che il più delle volte sia solo una questione di convenzioni, probabilmente propria di ogni campo. Penso che in un contesto medico, in due fattori uno dei due sia quasi sempre chiamato "trattamento" e l'altro "blocco".

In genere, come dice ocram, l'effetto di blocco sarà un effetto casuale, ma non penso che sia sistematico. Lasciami dire che vuoi valutare l'efficacia di diversi trattamenti medici:

  • Primo progetto: ogni paziente prende solo un trattamento e l'efficienza viene misurata su una scala appropriata. Sospetti che il sesso del paziente sia interessante: avrai un "blocco" di maschi e un blocco di pazienti femminili. In questo caso, il blocco è un fattore con un effetto fisso.

  • Secondo disegno: ogni paziente prova tutti i trattamenti in momenti diversi. Poiché esiste una certa variabilità tra i pazienti, si considera ogni paziente come un "blocco". Sei interessato all'esistenza di una tale variabilità nella popolazione, ma non al suo valore in questi particolari pazienti. In questo caso, il blocco è un fattore con un effetto casuale.

Bene, insegno solo queste cose, cercando di attenermi alle convenzioni del dominio (in Francia) come le ho ottenute dai libri di testo, ma non ho mai partecipato a una sperimentazione clinica (e non voglio) ... quindi questo è solo i miei due centesimi ...!


1
Mi sembra che il blocco denoti una strategia più generale per ridurre gli errori sperimentali (tenendo conto dell'omogeneità all'interno del blocco), una manifestazione di questo approccio è l'uso di misurazioni ripetute2K

@chl Penso che tu abbia ragione! Stavo solo facendo alcuni esempi molto basilari ...
Elvis,

Sono buoni (un esempio con un esperimento raccolto / raccolto dall'agronomia lo renderebbe ancora più chiaro); Stavo solo sottolineando che il "blocco" va oltre il concetto di "fattore" e la distinzione fissa vs. casuale.
chl

@chl, se hai un buon (e semplice) riferimento su questo tipo di cose sarei felice di leggerlo (e dovresti pubblicare come risposta) ... (non sono accettati anche riferimenti così semplici!)
Elvis

Intendi example(aov)o il pacchetto R agricolae ? :-)
chl
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.