Recentemente ho avuto un cliente da me per fare un'analisi bootstrap perché un revisore della FDA ha affermato che la loro regressione errori-in-variabili non era valida perché quando si univano i dati dei siti l'analisi includeva il pooling dei dati di tre siti in cui due siti includevano alcuni esempi che erano lo stesso.
SFONDO
Il cliente aveva un nuovo metodo di analisi che voleva mostrare era "equivalente" a un metodo approvato esistente. Il loro approccio era di confrontare i risultati di entrambi i metodi applicati agli stessi campioni. Sono stati utilizzati tre siti per eseguire i test. Gli errori nelle variabili (regressione Deming) sono stati applicati ai dati di ciascun sito. L'idea è che se la regressione mostrasse che il parametro di pendenza era vicino a 1 e l'intercettazione vicino a 0 ciò avrebbe mostrato che le due tecniche di analisi davano quasi gli stessi risultati e quindi il nuovo metodo doveva essere approvato. Nel sito 1 avevano 45 campioni che davano loro 45 osservazioni accoppiate. Il sito 2 aveva 40 campioni e il sito 3, 43 campioni. Hanno eseguito tre regressioni Deming separate (assumendo un rapporto di 1 per gli errori di misurazione per i due metodi). Quindi l'algoritmo ha minimizzato la somma delle distanze perpendicolari al quadrato.
Nella loro presentazione il cliente ha sottolineato che alcuni dei campioni utilizzati nei siti 1 e 2 erano gli stessi. Nella revisione il revisore della FDA ha dichiarato che la regressione Deming non era valida perché sono stati utilizzati campioni comuni che causano "interferenze" che invalidano i presupposti del modello. Hanno richiesto l'applicazione di una regolazione bootstrap ai risultati Deming per tenere conto di questa interferenza.
A quel punto dal momento che il cliente non sapeva come fare il bootstrap, mi è stato introdotto. Il termine interferenza era strano e non ero sicuro di cosa stesse facendo il revisore. Ho supposto che il punto fosse davvero che il fatto che i dati aggregati avessero campioni comuni ci sarebbe stata una correlazione per i campioni comuni e quindi i termini di errore del modello non sarebbero stati tutti indipendenti.
L'ANALISI DEL CLIENTE
Le tre regressioni separate erano molto simili. Ognuno aveva parametri di pendenza vicini a 1 e intercettava vicino a 0. L'intervallo di confidenza al 95% conteneva 1 e 0 rispettivamente per la pendenza e l'intercetta. La differenza principale era una varianza residua leggermente più elevata nel sito 3. Inoltre, hanno confrontato questo con i risultati ottenuti facendo OLS e li hanno trovati molto simili (in un solo caso l'intervallo di confidenza per la pendenza basato su OLS non conteneva 1). Nel caso in cui la CI OLS per la pendenza non contenesse 1, il limite superiore dell'intervallo era simile a 0,99.
Con i risultati così simili in tutti e tre i siti, i dati del sito sembravano ragionevoli. Il client ha eseguito una regressione Deming in pool che ha portato a risultati simili. Alla luce di questi risultati, ho scritto un rapporto per il cliente contestando l'affermazione che le regressioni non erano valide. La mia tesi è che, poiché ci sono errori di misurazione simili in entrambe le variabili, il cliente aveva ragione a usare la regressione Deming come un modo per mostrare accordo / disaccordo. Le regressioni del singolo sito non hanno avuto problemi di errori correlati poiché non sono stati ripetuti campioni all'interno di un determinato sito. Raggruppamento dei dati per ottenere intervalli di confidenza più stretti.
Questa difficoltà potrebbe essere risolta semplicemente mettendo in comune i dati con i campioni comuni del sito 1 che si dice lasciato fuori. Anche i tre singoli modelli di sito non presentano il problema e sono validi. Questo mi sembra fornire una forte prova di accordo anche senza la messa in comune. Inoltre, le misurazioni sono state eseguite in modo indipendente nei siti 1 e 2 per i siti comuni. Quindi penso che anche l'analisi aggregata che utilizza tutti i dati sia valida perché gli errori di misurazione per un campione nel sito 1 non sono correlati agli errori di misurazione nel campione corrispondente nel sito 2. Ciò equivale a ripetere un punto nella progettazione spazio che non dovrebbe essere un problema. Non crea correlazione / "interferenza".
Nel mio rapporto ho scritto che un'analisi bootstrap non era necessaria perché non c'è alcuna correlazione per cui adeguarsi. I tre modelli di sito erano validi (nessuna "interferenza" possibile all'interno dei siti) e un'analisi in pool poteva essere eseguita rimuovendo i campioni comuni nel sito 1 durante l'esecuzione del pool. Un'analisi così aggregata non potrebbe avere un problema di interferenza. Una regolazione bootstrap non sarebbe necessaria perché non ci sono errori da regolare.
CONCLUSIONE
Il cliente era d'accordo con la mia analisi ma aveva paura di portarlo alla FDA. Vogliono che io faccia comunque la regolazione del bootstrap.
LE MIE DOMANDE
A) Sei d'accordo con (1) La mia analisi dei risultati del cliente e (2) la mia tesi che il bootstrap non è necessario.
B) Dato che devo eseguire il bootstrap della regressione Deming, sono disponibili procedure SAS o R per eseguire la regressione Deming sui campioni bootstrap?
EDIT: dato il suggerimento di Bill Huber, ho intenzione di esaminare i limiti della regressione degli errori nelle variabili per regressione sia su y che su x su y. Sappiamo già che per una versione di OLS la risposta è essenzialmente la stessa degli errori nelle variabili quando si presume che le due varianze di errore siano uguali. Se questo è vero per l'altra regressione, penso che ciò dimostrerà che la regressione Deming offre una soluzione appropriata. Sei d'accordo?
Per soddisfare la richiesta del cliente, devo eseguire l'analisi bootstrap richiesta che è stata vagamente definita. Eticamente penso che sarebbe sbagliato fornire solo il bootstrap perché non risolve davvero il vero problema del cliente, che è quello di giustificare la loro procedura di misurazione del dosaggio. Quindi darò loro entrambe le analisi e chiederò almeno che dicano alla FDA che oltre a fare il bootstrap ho fatto regressione inversa e limitato le regressioni Deming che ritengo più appropriate. Inoltre, penso che l'analisi mostrerà che il loro metodo è equivalente al riferimento e quindi anche la regressione di Deming è adeguata.
Ho intenzione di utilizzare il programma R che @whuber mi ha suggerito nella sua risposta per consentirmi di avviare la regressione Deming. Non conosco molto bene R ma penso di potercela fare. Ho R installato insieme a R Studio. Sarà abbastanza facile per un principiante come me?
Inoltre ho SAS e sono più a mio agio con la programmazione in SAS. Quindi, se qualcuno conosce un modo per farlo in SAS, mi farebbe piacere saperlo.