Quando le persone implementano test di permutazione per confrontare un singolo campione con una media (ad esempio, come si potrebbe fare con un test t di permutazione), come viene gestita la media? Ho visto implementazioni che richiedono una media e un campione per un test di permutazione, ma non è chiaro cosa stiano effettivamente facendo sotto il cofano. Esiste anche un modo significativo per eseguire un test di permutazione (ad esempio, test t) per un campione rispetto a una media presunta? O, in alternativa, stanno semplicemente fallendo un test di non permutazione sotto il cofano? (ad esempio, nonostante la chiamata a una funzione di permutazione o l'impostazione di un flag di test di permutazione, l'impostazione predefinita di un test t standard o una funzione simile)
In un test di permutazione standard a due campioni, uno avrebbe due gruppi e randomizzerebbe l'assegnazione delle etichette. Tuttavia, come viene gestito quando un "gruppo" è una media presunta? Ovviamente, una media presunta non ha dimensioni del campione in sé e per sé. Allora, qual è il modo tipico di lavorare la media in un formato di permutazione? Il campione "medio" è considerato un singolo punto? Un campione di uguali dimensioni per il gruppo campione? Un campione di dimensioni infinite?
Dato che una media assunta è, beh, assunta, direi che tecnicamente ha un supporto infinito o qualunque supporto tu voglia assumere per esso. Tuttavia, nessuno di questi è molto utile per un calcolo effettivo. Un campione di dimensioni uguali con valori tutti uguali alla media sembra essere ciò che viene fatto a volte con alcuni test (ad esempio, basta riempire l'altra metà delle coppie con la posizione presunta). Questo ha un po 'di senso, poiché è il campione di uguale lunghezza che vedresti se la tua media presunta fosse corretta senza varianza.
Quindi la mia domanda è questa: in pratica, le persone emulano effettivamente la randomizzazione dell'etichetta dello stile di test di permutazione quando il secondo set è una media (o un valore ipotizzato astratto simile)? In tal caso, come fanno le persone a gestire la randomizzazione delle etichette quando lo fanno?