Bene, se conoscessi le varianze negli accoppiati e negli accoppiati (che sarebbero generalmente molto più piccoli), i pesi ottimali per le due stime della differenza nei gruppi significherebbe avere pesi inversamente proporzionali alla varianza dell'individuo stime della differenza nelle medie.
[Modifica: si scopre che quando le varianze sono stimate, questo è chiamato lo stimatore di Graybill-Deal. Ci sono stati alcuni documenti su di esso. Eccone uno]
La necessità di stimare la varianza causa qualche difficoltà (il rapporto risultante delle stime di varianza è F, e penso che i pesi risultanti abbiano una distribuzione beta e una statistica risultante sia un po 'complicata), ma dal momento che stai considerando l'avvio del bootstrap, questo potrebbe essere meno di una preoccupazione.
Una possibilità alternativa che potrebbe essere più piacevole in un certo senso (o almeno un po 'più robusta rispetto alla non normalità, dal momento che stiamo giocando con rapporti di varianza) con una perdita di efficienza molto ridotta al normale è quella di basare una stima combinata di spostamento test di rango accoppiati e non accoppiati - in ogni caso una sorta di stima di Hodges-Lehmann, nel caso non accoppiato basato su mediane di differenze incrociate campionarie a coppie e nel caso accoppiato su mediane di differenze di coppie medie. Ancora una volta, la combinazione lineare ponderata minima tra le due sarebbe con pesi proporzionali alle inversioni di varianze. In quel caso probabilmente mi spingerei verso una permutazione (/ randomizzazione) piuttosto che un bootstrap - ma a seconda di come implementate il bootstrap possono finire nello stesso posto.
In entrambi i casi potresti voler rinforzare le tue varianze / ridurre il tuo rapporto di varianza. Entrare nel campo da baseball giusto per il peso è buono, ma perderai pochissima efficienza al normale rendendolo leggermente robusto. ---
Alcuni pensieri aggiuntivi che non avevo abbastanza chiaramente risolto nella mia testa prima:
Questo problema ha nette somiglianze con il problema Behrens-Fisher, ma è ancora più difficile.
Se abbiamo fissato i pesi, abbiamo potuto solo colpire in un tipo di approssimazione Welch-Satterthwaite; la struttura del problema è la stessa.
Il nostro problema è che vogliamo ottimizzare i pesi, il che significa che la ponderazione non è corretta - e in effetti, tende a massimizzare la statistica (almeno approssimativamente e quasi quasi in grandi campioni, dal momento che ogni set di pesi è una quantità casuale che stima lo stesso numeratore e stiamo cercando di ridurre al minimo il denominatore; i due non sono indipendenti).
Ciò, a mio avviso, peggiorerebbe l'approssimazione del chi-quadro e influenzerebbe quasi sicuramente ulteriormente la df di un'approssimazione.
[Se questo problema è fattibile, potrebbe anche esserci una buona regola empirica che direbbe 'puoi fare quasi altrettanto se usi solo i dati associati in questi insiemi di circostanze, solo i non abbinati in questi altri insiemi di condizioni e nel resto, questo schema di peso fisso è di solito molto vicino all'ottimale '- ma non trattengo il respiro aspettando quella possibilità. Una tale regola di decisione avrebbe senza dubbio un certo impatto sul vero significato in ciascun caso, ma se tale effetto non fosse così grande, una tale regola empirica darebbe un modo semplice per le persone di utilizzare software legacy esistente, quindi potrebbe essere desiderabile prova a identificare una regola come quella per gli utenti in una situazione del genere.]
---
Modifica: Nota per se stessi - È necessario tornare indietro e compilare i dettagli del lavoro sui test "campioni sovrapposti", in particolare i test t di campioni sovrapposti
---
Mi viene in mente che un test di randomizzazione dovrebbe funzionare bene -
dove i dati sono accoppiati si autorizzano casualmente le etichette di gruppo all'interno di coppie
dove i dati non sono accoppiati ma si presume abbiano una distribuzione comune (sotto il valore null), si autorizzano le assegnazioni di gruppo
ora puoi basare i pesi sulle due stime dello spostamento dalle stime della varianza relativa ( w1= 1 / ( 1 + v1v2)), calcola la stima ponderata dello spostamento di ciascun campione randomizzato e vedi dove si inserisce il campione nella distribuzione randomizzata.
(Aggiunto molto più tardi)
Carta possibilmente pertinente:
Derrick, B., Russ B., Toher, D. e White, P. (2017),
"Statistica dei test per il confronto di mezzi per due campioni che includono osservazioni sia paired che indipendenti"
Journal of Modern Applied Statistical Methods , maggio , Vol. 16, n. 1, 137-157.
doi: 10.22237 / jmasm / 1493597280
http://digitalcommons.wayne.edu/cgi/viewcontent.cgi?article=2251&context=jmasm